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Preface ES 


统计 学 是 对 数据 进行 收集 、 整 理 、 展 示 、 分 析 和 解释 ,以 帮助 人 们 更 加 有 效 
地 做 出 正确 认识 客观 世界 数量 规律 的 方法 论 科学 。 在 众多 专业 、 学 科 领 域 , 特 
别 是 在 商务 和 经 济 活动 中 有 着 重要 的 应 用 。( 统 计 学 基础 (第 二 版 ) 面 向 商科 
类 专业 的 学 习 者 系统 地 介绍 了 统计 学 及 其 各 个 领域 应 用 方面 的 知识 和 技能 。 
以 基础 统计 应 用 为 导向 ,做 到 内 容 简 洁 , 学 练 一 体 ,把 对 统计 方法 的 学 习 理 论 
和 领会 尽 可 能 地 在 解决 实际 问题 的 过 程 中 展现 出 来 ,并 尝试 从 专业 角度 运用 
统计 结论 对 问题 进行 分 析 和 解答 ,更 易于 学 习 者 理解 和 掌握 。 

本 书 内 容 以 项 目 化 方式 编排 ,关键 知识 点 教 、 练 一 体 化 ,增加 了 最 新 统计 
案例 在 商业 领域 的 重要 创新 成 果 和 应 用 。 用 二 维 码 链接 扩展 了 各 类 学 习 资 
源 , 通 过 学 习 这 些 文本 ,视频 ,使 学 习 者 更 加 容易 理解 和 掌握 这 些 内 容 。 每 个 
项 目 都 以 一 篇 “实践 中 的 统计 ”的 文章 开始 ,这 些 文章 描述 了 本 项 目 将 要 介绍 
的 统计 方法 的 应 用 。 大 部 分 的 案例 都 是 编者 长 期 教学 过 程 中 的 积累 ,实用 性 、 
针对 性 较 强 。 

本 书 中 的 示例 和 练习 都 以 真实 的 数据 和 资料 为 基础 ,这 些 数据 资料 来 源 
广泛 ,我 们 进行 了 有 针对 性 的 讨论 、 演 示 和 相应 的 练习 。 我 们 相信 ,实际 数据 
的 使 用 会 让 更 多 的 学 习 者 对 统计 资料 产生 兴趣 ,在 学 习 统 计 方 法 的 同时 学 会 
其 应 用 方法 。 

Excel 虽然 不 是 专业 的 统计 软件 ,但 能 够 解决 大 部 分 的 数据 分 析 问 题 。 本 
书 中 我 们 演示 了 这 个 软件 的 统计 应 用 功能 , 它 会 使 我 们 的 统计 工作 变 得 更 加 
轻松 ,因而 ,让 学 生 了 解 和 掌握 它 的 应 用 方法 也 很 重要 。 

本 书 中 我 们 设计 了 统计 案例 的 分 析 和 实 训 内 容 , 需 要 学 习 者 认真 完成 。 
这 些 内 容 的 完成 .对 于 大 家 理解 统计 方法 和 应 用 大 有 神 益 。 

最 后 一 个 项 目 我 们 讨论 了 一 个 统计 学 如 何 应 用 于 质量 管理 的 具体 案例 ， 
供 学 习 者 参考 。 当 然 ,统计 学 的 应 用 不 仅 限于 此 , 它 还 有 更 为 广泛 的 应 用 领域 
需要 学 习 者 不 断 加 以 实践 。 

本 书 由 兰州 资源 环境 职业 技术 学 院 汪 大 金 , 扎 兰 屯 职业 学 院 白金 英 任 主 
编 ;信阳 职业 技术 学 院 闵 悦 昕 、 刘 晓 梦 ,甘肃 财贸 职业 学 院 李 斌 成 ,佳木斯 技师 
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项 目 1 ”数据 与 统计 


>> > | 实践 中 的 统计 
淘宝 数据 :数据 背后 的 价值 


淘宝 的 数据 分 析 一 直 走 在 电子 商务 领域 的 前 沿 , 你 知道 淘宝 是 如 何在 大 数据 中 做 
数据 分 析 的 吗 ? 不 看 平均 ,看 数据 分 布 。 因 为 凡是 和 “总 和 ”或 者 “平均 ”类 的 统计 有 关 
的 数据 都 会 丢失 掉 很 多 重要 的 信息 。 例 如 ,李嘉诚 来 我 们 公司 参观 ,这 一 时 间 我 们 公司 
办 公 室 里 的 个 人 “平均 资产 ”就 会 因为 李嘉诚 一 个 人 被 抬 高 到 人 均 几 亿 身家 。 如 果 有 人 
根据 这 个 “平均 资产 ?数据 来 判定 说 我 们 办 公 室 的 人 都 是 豪华 游艇 的 潜在 顾客 ,这 是 很 
RBH, 

可 实际 上 ,我 们 每 天 都 在 做 着 类 似 的 判断 ,比如 , 当 我 们 听 到 说 顾客 “平均 在 线 时 间 ” 
是 3 分 34 秒 ,就 可 能 根据 这 个 时 间 来 进行 业务 决策 。 例 如 设置 “停留 时 间 超 过 3 分 34 秒 
为 高 价值 流量 ”, 或 者 设置 系统 ,在 用 户 停留 了 3 分 34 秒 还 没有 下 单 的 话 就 弹出 在 线 客服 
服务 窗口 。 我 们 设置 这 些 时 间 点 的 根据 是 “平均 停留 时 间 ”, 在 我 们 的 想象 里 ,我 们 的 每 个 
顾客 都 有 着 “平均 的 ”表现 ,停留 时 间 大 致 都 是 3 分 34 秒 。 可 实际 上 真正 的 顾客 访问 时 间 
有 长 有 短 , 差 别 较 大 :在 一 些 数 据 中 我 们 可 以 看 出 ,访客 平均 停留 在 页 面 的 时 间 是 非常 的 
短暂 。 

例如 ,我 们 看 到 上 个 月 平均 订单 金额 500 元 / 单 , 这 个 月 也 是 500 元 / 单 , 可 能 会 觉得 数 
字 没 有 变化 。 可 是 实际 上 有 可 能 上 个 月 5 万 单 都 是 400 一 600 元 ,而 这 个 月 5 万 单 则 是 2 万 
单 300 元 ,2 万 单 400 元 ,5 千 单 500 元 ,5 千 单 超过 2500 元 一 一 客户 购买 习惯 已 经 发 生 了 
巨大 变化 :一 方面 可 能 是 客户 订单 在 变 少 ( 可 能 是 因为 产品 单价 上 升 , 采 购 数量 减少 ,或 者 客 
户 选 择 了 比较 便宜 的 替代 品 ); 另 一 方面 ,出现 了 一 些 相对 较 大 的 订单 (可 能 是 中 小 企业 采 
购 ,或 者 是 网 站 扩充 产品 线 见效 了 ) 一 一 看 数据 分 布 可 以 让 我 们 更 容易 发 现 这 些 潜在 的 变化 
并 及 时 的 做 出 应 对 。 这 些 隐 藏 在 数据 背后 的 价值 ,只 有 深刻 洞察 数据 分 布 变 化 ,才能 充分 利 
用 数据 分 析 做 出 相应 的 决策 。 

如 何 挖掘 数据 及 其 价值 ,本 项 目 我 们 将 从 数据 统计 的 基本 概念 出 发 ,探讨 可 用 于 统计 分 
析 的 数据 类 型 ,通过 对 数据 的 描述 统计 和 推断 统计 使 得 数据 解释 和 统计 分 析 工 作 更 具有 实 
际 价值 和 有 意义 。 

我 们 经 常会 在 各 类 媒体 的 报道 中 看 到 下 面 各 种 报道 : 

。2018 年 11 月 30 日 国家 统计 局 服务 业 调 查 中 心 和 中 国 物流 与 采购 联合 会 发 布 了 中 国 
采购 经 理 指数 。11 月 份 ,制造 业 PMI 为 50.0%, 环 比 小 幅 回 落 0. 2 个 百分点 ,处 于 临界 点 。 
本 月 主要 特点 :(1) 价 格 指 数 明 显 回 落 。 受 近期 部 分 大 宗 商 品 价格 下 行 等 因素 影响 ,主要 原 
材料 购 进 价格 指数 和 出 厂价 格 指数 均 降 至 年 内 低 点 ,分 别 为 50.3% 和 46.4%, 比 上 月 回落 
7.7 和 5.6 个 百分点 。(2) 生 产 保持 稳定 ,需求 扩张 减缓 。 生 产 指数 为 51.9%, 比 上 月 微 落 
0.1 个 百分点 ,持续 位 于 景气 区 间 。 新 订单 指数 为 50.4%, 低 于 上 月 0.4 个 百分点 ,高 于 临 
界 点 ,表明 企业 产品 订货 量 增 速 有 所 放 缓 。(3) 制 造 业 多 数 行业 处 于 扩 
张 区 间 。 其 中 ,食品 及 酒 饮料 精制 茶 、 纺 织 服装 服饰 、 医 药 、 铁 路 船舶 航 
空 航天 设备 .电气 机 械 器 材 等 制造 业 PMI 位 于 52.0% 及 以 上 相对 较 高 
运行 水 平 。 受 部 分 地 区 采暖 季 加 大 环境 治理 力度 等 因素 影响 ,高 耗 能 行 
业 PMI 降 至 48.4%”。(4) 进 出 口 景气 度 继 续 低 位 运行 。 新 出 口 订单 指 
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数 和 进口 指数 为 47.0% 和 47.1%, 均 持续 位 于 临界 点 以 下 ,表明 在 全 球 经 济 复苏 放 缓 和 贸 
易 摩 擦 不 确定 性 增加 的 影响 下 ,近期 进出 口 下 行 压力 有 所 加 大 。 
(数据 来 源 : 国 家 统计 局 网 站 ,2018. 11. 30) 
。 中 国 网 民 以 青少年 、 青 年 和 中 年 群体 为 主 。 截 至 2018 年 6 A, 
10 一 39 岁 群体 占 总 体 网 民 的 70.8%。 其 中 20—29 岁 年 龄 段 的 网 民 占 比 
最 高 , 达 27.9%%;10 一 19 岁 .30 一 39 岁 群 体 占 比分 别 为 18. 2%、24.7%， 
与 2017 年 末 基 本 保持 一 致 。30 一 49 岁 中 年 网 民 群 体 占 比 由 2017 年 末 
的 36.7% KE 39.9%, 互 联网 在 中 年 人 群 中 的 渗透 加 强 。 E 
(数据 来 源 : 中 国 网 信 网 ,2018. 8. 20) 
。 数 据 显示 ,2016 年 以 来 ,人 民 币 汇率 小 幅 贬 值 , 汇 率 弹 性 明显 增 
强 。 截 至 9 月 末 , 人 民 币 对 美元 汇率 中 间 价 为 6.1525 元 , 比 上 年 末 贬 值 
556 个 基点 ,贬值 幅度 为 0.9%。 虽 然 总 体 上 看 ,是 贬值 的 ,但 是 在 每 天 
的 汇率 波动 中 ,人 民 币 一 改 以 往 的 单 向 趋势 ,有 升 有 贬 的 走势 越 来 越 明 
显 。 以 今年 上 半年 为 例 ,119 个 交易 日 中 51 个 交易 日 升值 .68 个 交易 日 
出 现 贬 值 。 


(央视 新 闻 ,2016. 1. 2) 
。 肥 胖 可 使 人 减 寿 。 美 国 一 项 新 研究 显示 ,身高 体重 指数 大 于 40 的 严重 肥胖 者 比 正常 
体重 者 的 平均 寿命 最 多 要 短 近 14 年 ,因为 他 们 更 容易 出 现 癌症 ,心脏 病 、. 中 风 、 糖 尿 病 和 肝 
脏 疾 病 等 健康 问题 并 因此 过 早死 亡 。 
(作者 :Cari Kitahara; 资 料 来 源 :《PLoS 医学 》2014. 7. 24) 
上 述 报道 中 ,引用 了 数值 事实 ,我 们 把 这 类 报道 称 之 为 统计 资料 ,也 称 统计 信息 。 通 过 
这 些 信息 , 可 以 帮助 我 们 了 解 自 然 科学 动态 以 及 经 济 活动 的 情况 。 我 们 把 搜集 、 分 析 、 表 述 
和 解释 数据 进而 认识 客观 现象 数量 规律 的 方法 称 为 统计 学 (statistic)。 特 别 是 商务 活动 和 
经 济 研 究 领 域 ,搜集 ,分 析 和 解释 数据 旨 在 帮助 管理 者 和 决策 者 更 好 地 理解 商务 活动 和 经 济 
环境 的 变化 ,从 而 更 科学 、 准 确 地 作出 决策 。 通 过 本 书 , 我 们 可 以 看 到 统计 学 在 各 领域 的 广 
泛 应 用 ,以 及 它 是 如 何 影响 我 们 的 生活 的 。 因 此 ,统计 学 的 学 习 更 注重 在 实际 工作 中 的 应 
用 ,以 及 使 用 计算 机 对 数据 进行 分 析 和 处 理 。 


1.1 统计 学 在 经 济 活动 中 的 应 用 


P> 1.1.1 财务 管理 


公司 的 财务 数据 是 投资 者 的 重要 参考 依据 。 会 计 事 务 所 和 投资 咨询 公司 根据 公司 提供 
的 财务 数据 进行 统计 分 析 ,为 投资 者 提供 参考 。 特 别 是 股票 市 场 .投资 者 可 以 根据 上 市 公司 
提供 的 包括 市 一 率 和 股息 等 财务 数据 来 判断 某 只 股票 的 价值 是 高 估 还 是 低估 ,从 而 做 出 买 
卖 还 是 持 股 的 决策 。 例 如 ,2015 年 10 月 时 ,高 盛 将 携程 股票 评级 上 调 为 * 买 人 ”, 它 认为 携程 
的 每 股 收益 2016 年 将 下 降 超过 50%, 降 至 68 美 分 ,到 2017 年 回升 到 1. 91 美元 。 携 程 目前 
的 股价 是 高 盛 每 股 收益 估 值 1. 91 美元 的 22 倍 。 高盛 给 出 的 目标 价 为 60 美元 ,这 意味 着 携 
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程 还 有 40% 的 上 涨 空间 。 


P> 1.1.2 市 场 营 销 


从 商业 本 质 上 说 ,营销 的 过 程 就 是 满足 市 场 需求 .提供 客户 服务 价值 .完成 交易 实现 利 
润 的 过 程 。 互 联网 的 迅速 发 展 ,改变 了 消费 者 的 消费 模式 和 行为 习惯 ,也 飞速 改变 着 传统 的 
商业 模式 ,数据 营销 已 成 为 市 场 营销 的 新 手段 。 例 如 ,顺丰 速 运 每 天 数 以 百 万 计 的 包 右 信息 
通过 其 终端 POS 扫描 后 ,源源 不 断 地 汇总 到 数据 中 心 ,经 过 大 约 10 道 工 序 .12 个 小 时 后 , 顾 
客 就 可 以 收 到 自己 的 包 庄 。 而 支撑 每 天 数 以 百 万 计 的 包裹 快速 到 达 的 是 顺丰 速 运 庞大 的 信 
息 系 统 和 数据 业务 处 理 的 高 效 运转 。 


b 1.1.3 质量 管理 


产品 质量 管理 是 统计 学 在 生产 管理 活动 中 的 一 项 重要 应 用 。 各 种 统计 质量 管理 图 用 
于 监测 生产 过 程 和 产品 质量 。 特 别 是 六 西格玛 管理 ,已 经 成 为 一 种 重要 的 管理 理念 。 而 
统计 数据 是 实施 六 西格玛 管理 的 重要 工具 .以 数字 说 明 一 切 。 所 有 的 生产 表现 、 执 行 力 
等 ,都 量化 为 具体 的 数据 。 例 如 ,海尔 认识 到 改进 其 产品 质量 的 重要 性 ,提出 的 目标 是 出 
厂 的 产品 每 百 万 件 出 现 质量 缺陷 的 概率 不 超过 3.4, 这 个 质量 水 平 就 是 六 西格玛 质量 
K*¥ 


P> 1.1.4 经 济 预测 


人 们 经 常 要 求 经 济 学 家 对 未 来 的 经 济 和 某 一 方面 的 发 展 做 出 预测 ,他 们 在 预测 时 需要 
用 到 各 种 统计 信息 。 例 如 ,在 预测 通货 膨胀 时 ,利用 如 市 场 价格 指数 .失业 率 、 制 造 业 开工 率 
等 统计 数据 ,借助 于 统计 分 析 方 法 可 以 预测 经 济 发 展 趋势 。 


1.1.5 人 力 资 源 管理 


借助 于 数据 统计 和 分 析 工 具 , 公 司 对 人 力 资源 的 管理 更 加 高 效 。 
例如 ,Google 作为 最 受 欢 迎 的 IT 公司 之 一 ,每 月 收 到 数 十 万 份 以 上 
的 求职 简历 ,该 如 何 筛选 出 最 合适 的 简历 呢 ? Google 借助 了 大 数据 
技术 ,让 所 有 在 职员 工 各 完成 一 份 300 道 问题 的 问卷 ,并 根据 问卷 结 
果 建 立 出 来 一 套 模型 ,这 套 模 型 让 Google 发 现 哪 些 是 有 潜力 的 申请 
者 。IBM 是 人 力 资源 管理 的 行业 领先 者 .他 们 通过 Professional 
Marketplace 数 据 库 ,找到 雇员 成 本 和 绩效 水 平 最 佳 的 资源 配置 方式 ,这 种 方法 使 IBM 
的 项 目 经 理 组 建 项 目 团队 就 像 订 机 票 一 样 简单 。 
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1 2 统计 中 的 几 个 基本 概念 


数据 (date) 是 描述 和 解释 研究 对 象 而 搜集 、 分 析 和 汇总 的 事实 和 数 
字 。 应 用 于 特定 对 象 而 搜集 的 所 有 数据 称 为 研究 的 数据 集 。 表 1-1 是 我 
国 制造 业 上 市 公司 分 行业 的 平均 市 一 率 的 数据 集 。 通 过 对 全 部 制造 业 
上 市 公司 的 市 列 率 深度 分 析 ,可 为 投资 者 提供 了 投资 建议 和 投资 依据 。 

表 1-1 上 市 公司 行业 平均 市 盈 率 统计 表 ( 部 分 ) 


行业 编码 静态 市 盈 率 
行业 名 称 公司 数量 
门类 大 类 加 权 平 均 | 中 位 数 | 加 权 平 均 | 中 位 数 
A 农林 、 牧 、 渔 业 24 42.01 | 50.86 30.45 | 30.16 
Aol | 农业 8 32.91 | 30.88 33.42 | 26.53 
A02 | 林业 2 73.67 | 73.67 55 55 
A03 | 畜牧 业 7 54.52 | 51.93 32.54 | 28.6 
A04 | 渔业 6 35.5 | 31.61 23.37 | 27.12 
A05 | 农 . 林 、 牧 \ 渔 服务 业 1 NA NA 48. 22 | 48.22 
B 采矿 业 25 18.38 | 34.21 14.34 | 20.6 
B06 | 煤炭 开采 和 洗 选 业 6 10.41 | 11.63 8. 16 9.1 
B07 | 石油 和 天 然 气 开采 业 1 23.51 | 23.51 17.68 | 17.68 
BOS | 黑色 金属 矿 采 选 业 2 60. 36 NA NA NA 
B09 | 有 色 金 属 矿 采 选 业 6 28.81 | 32.46 26.15 | 27.52 
B10 | 非 金 属 矿 采 选 业 1 43.2 43.2 33.64 | 33.64 


(数据 来 源 : 国 证 网 ,2018. 11. 30) 


> 1.2.1 总 体 与 个 体 


总 体 (population) 是 指 客观 存在 的 \ 在 同一 性 质 基础 上 集合 起 来 的 许多 单位 的 整体 。 构 
成 总 体 的 这 些 单位 称 为 总 体 单位 。 在 表 1-1 中 ,总 体 就 是 所 有 上 市 公司 。 

确定 总 体 与 总 体 单位 , 需 注意 以 下 两 个 方面 : 

(1) 构成 总 体 的 单位 必须 是 同 质 的 ,不 能 把 不 同 质 的 单位 混在 总 体 之 中 。 例 如 ,研究 职 
工 的 工资 水 平 , 就 只 能 将 靠 工资 收入 的 职工 列 人 统计 总 体 的 范围 。 同 时 ,也 只 能 对 职工 的 工 
资 收入 进行 考察 ,对 职工 由 其 他 方面 取得 的 收入 就 要 加 以 排除 ,这样 才 能 正确 反映 职工 的 工 
资 水 平 。 

(2) 总 体 与 总 体 单位 具有 相对 性 , 随 着 研究 任务 的 改变 而 改变 。 同 一 单位 可 以 是 总 体 
也 可 以 是 总 体 单位 。 例 如 ,要 了 解 全 国 工业 企业 职工 的 工资 收入 情况 ,那么 全 部 工厂 是 总 
体 ,各 个 工厂 是 总 体 单位 。 如 果 旨 在 了 解 某 个 企业 职工 的 工资 收入 情况 , 则 该 企业 就 成 了 总 
体 , 每 位 职工 的 工资 就 是 总 体 单位 了 。 
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个 体 (element) 是 指 构成 总 体 数据 的 每 一 个 子 体 。 在 表 1-1 中 ,每 一 个 行业 可 以 分 割 成 
一 个 个 体 ,数据 集 由 行业 个 体 构成 。 


> 1.2.2 变量 与 参数 


变量 (variable) 是 统计 学 研究 对 象 的 特征 ,变量 值 就 是 变量 的 具体 表现 。 表 1-1 的 数据 
集中 有 以 下 3 个 变量 : 

d) 公司 数量 ; 

(2) 静态 市 盈 率 ; 

(3) 滚动 市 盈 率 。 

参数 (parameter) 是 描述 总 体 特 征 的 概括 性 数字 度量 , 它 是 研究 者 想 要 了 解 的 总 体 的 某 
种 特征 值 。 在 表 1-1 中 ,描述 农业 类 上 市 公司 有 24 家 ,加 权 平均 的 静态 市 和 列 率 是 42. 01, 加 
权 平 均 的 滚动 市 一 率 是 30. 45 ,这 些 数字 度量 被 称 为 参数 。 在 一 项 研究 中 ,收集 的 个 体 变量 
观测 量 值 形成 的 集合 , 称 为 一 个 观测 值 。 在 表 中 ,我 们 看 到 的 第 一 个 观测 值 的 测量 值 集合 是 
24,42. 01,50. 86,30. 45,30. 16, 


b 1.2.3 统计 标志 与 指标 


| 1. 统计 标志 


统计 标志 简称 标志 ,是 指 统计 总 体 各 单位 所 具有 的 共同 特征 的 名 称 。 从 不 同 角 度 考察 ， 
每 个 总 体 单 位 可 以 有 许多 特征 。 例 如 ,每 个 职员 可 以 有 人 性别、 年 龄 .国籍 .服务 年 限 等 特征 。 
这 些 都 是 职员 的 标志 。 

总 体 单位 是 统计 标志 的 直接 承担 者 ,是 载体 ;统计 标志 依附 于 总 体 单 位 并 说 明 总 体 单位 
的 属性 和 特征 。 依 附 于 某 个 总 体 单 位 的 标志 可 以 有 多 个 。 当 一 个 统计 标志 在 各 个 单位 的 具 
体 表现 都 相同 时 ,这 个 标志 称 为 不 变 标志 ; 当 一 个 标志 在 各 个 单位 的 具体 表现 有 可 能 不 同 
时 ,这 个 标志 称 为 可 变 标志 或 变异 标志 。 

例如 ,中 国 第 六 次 人 口 普查 规定 :“ 人 口 普 查 的 对 象 是 具有 中 华人 民 共 和 国 国籍 并 在 中 
华人 民 共 和 国 国 境内 常住 的 人 。” 按 照 这 一 规定 ,在 作为 调查 对 象 的 人 口 总 体 中 ,国籍 和 在 国 
境内 居住 是 不 变 标志 ,而 性 别 、 年 龄 民族、 职业 等 则 是 变异 标志 。 不 变 
标志 是 构成 统计 总 体 的 基础 ,因为 至 少 必须 有 一 个 不 变 标志 将 各 总 体 单 
位 联结 在 一 起 ,才能 使 它 具 有 “ 同 质 性 ”, 从 而 构成 一 个 总 体 。 变 异 标志 
是 统计 研究 的 主要 内 容 ,因为 如 果 标 志 在 各 总 体 单位 之 间 的 表现 都 相 
同 , 那 就 没有 进行 统计 分 析 研 究 的 必要 了 。 

标志 根据 其 性 质 分 类 ,可 以 分 为 品质 标志 和 数量 标志 。 品 质 标志 表 
示 事 物 的 质 的 特性 ,是 不 能 用 数值 表示 的 。 例 如 雇员 的 性 别 、 国 籍 、 工 种 等 。 数 量 标 志 表 示 
事物 的 量 的 特性 ,是 可 以 用 数值 表示 的 ,如 雇员 年 龄 .工资 、 服 务 年 限 等 。 品 质 标志 主要 用 于 
分 组 ,将 性 质 不 相同 的 总 体 单位 划分 开 来 ,便于 计算 各 组 的 总 体 单位 数 , 计 算 结 构 和 比例 指 
标 。 数 量 标志 既 可 用 于 分 组 ,也 可 用 于 计算 标志 总 量 及 其 他 各 种 质量 指标 。 
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E 统计 指标 


统计 指标 简称 指标 ,是 反映 同类 社会 经 济 现象 总 体 数量 特征 的 范畴 及 其 具体 数值 。 

统计 指标 通常 有 两 种 理解 和 使 用 方法 :一 是 用 来 反映 总 体现 象 总 体 数 量 状况 的 基本 概 
念 。 例 如 ,年 末 全 国人 口 总 数 、 全 年 国内 生产 总 值 . 国 内 生产 总 值 年 度 增长 率 等 。 二 是 反映 
现象 总 体 数量 状况 的 概念 和 数值 。 例 如 ,2010 年 我 国 年 末 总 人 口 数 为 137 627 万 人 ,全 社会 
固定 资产 投资 增长 率 为 13% 等 。 

(1) 统计 指标 按照 其 反映 的 内 容 或 其 数值 表现 形式 ,可 以 分 为 总 量 指 标 、 相 对 指标 和 平 
均 指标 三 种 。 总 量 指标 是 反映 现象 总 体 规模 的 统计 指标 ,通常 以 绝对 数 的 形式 来 表现 ,因此 
又 称 为 绝对 数 。 例 如 ,土地 面积 .国内 生产 总 值 . 财 政 收 入 等 。 总 量 指标 按 其 反映 的 时 间 状 
况 不 同 ,又 可 以 分 为 时 期 指标 和 时 点 指标 。 时 期 指标 又 称 时 期 数 , 它 反 映 的 是 现象 在 一 段 时 
期 内 的 总 量 , 如 产品 产量 ,能源 生产 总 量 . 财 政 收入 .商品 零售 额 等 。 时 期 数 通 常 可 以 累积 ， 
从 而 得 到 更 长 时 期 内 的 总 量 。 时 点 指标 又 称 时 点 数 , 它 反映 的 是 社会 经 济 现象 在 某 一 时 刻 
上 的 总 量 ,如 年 末 人 口 数 、 科 技 机 构 数 、 公 司 员 工 数 、 股 票 价格 等 。 时 点 数 通 常 不 能 累积 ,各 
时 点 数 累计 后 没有 实际 意义 。 

相对 指标 又 称 相对 数 ,是 两 个 绝对 数 之 比 , 如 经 济 增长 率 、 物 价 指数 、 全 社会 固定 资产 增 
长 率 等 。 相 对 数 的 表现 形式 通常 为 比例 和 比率 两 种 。 

平均 指标 又 称 平均 数 或 均值 . 它 反映 的 是 社会 经 济 现象 在 某 一 空间 或 时 间 上 的 平均 数 
量 状况 ,如 人 均 国 内 生产 总 值 、 人 均 利润 等 。 

(2) 统计 指标 按 其 所 反映 总 体现 象 的 数量 特性 的 不 同 ,可 分 为 数量 指标 和 质量 指标 。 
数量 指标 是 反映 社会 经 济 现象 总 规模 水 平和 工作 总 量 的 统计 指标 ,一 般 用 绝对 数 表 示 。 如 
职工 人 数 、 工 业 总 产值 .工资 总 额 等 。 

质量 指标 是 反映 总 体 相对 水 平 或 平均 水 平 的 统计 指标 ,一 般 用 相对 数 或 平均 数 表示 。 
如 计划 完成 程度 .平均 工资 等 。 

由 于 统计 指标 反映 一 定 社会 经 济 范畴 的 内 容 . 因 此 ,统计 指标 的 确定 ,一 方面 ,必须 和 经 
济 理论 对 范畴 所 作 的 一 般 概括 相符 合 , 要 以 经 济 理论 为 指导 ,设置 科学 的 统计 指标 ; 另 一 方 
面 , 统 计 指 标 又 必须 是 对 社会 经 济 范畴 的 进一步 具体 化 ,才能 确切 地 反映 社会 经 济 现象 的 数 
量 关系 。 如 经 济 学 对 劳动 生产 率 作 了 一 般 的 概括 说 明 , 即 劳动 生产 率 是 表明 单位 劳动 时 间 
所 创造 的 使 用 价值 。 但 劳动 生产 率 作为 一 个 统计 指标 时 ,就 必须 明确 规定 其 劳动 时 间 是 指 
雇员 的 劳动 时 间 。 

(3) 统计 指标 按 管理 功能 作用 不 同 ,可 以 分 为 描述 指标 .评价 指标 和 预警 指标 。 描 述 指 
标 主要 是 反映 社会 经 济 运行 的 状况 、 过 程 和 结果 ,提供 对 社会 经 济 总 体现 象 的 基本 认识 ,是 
统计 信息 的 主题 。 例 如 ,反映 社会 经 济 条 件 的 土地 面积 指标 、 自 然 资 源 拥有 量 指标 、 社 会 财 
富 指标 、 劳 动 资源 指标 、 科 技 力 量 指标 ;反映 生产 经 营 过 程 和 结果 的 国民 生产 总 值 指标 .工农 
业 总 产值 指标 、 国 民 收 入 指标 .固定 资产 指标 、 流 动 资金 指标 .利润 指标 ;反映 社会 物质 文化 
娱乐 设施 指标 、 医 疗 床位 数 指标 等 。 

评价 指标 是 用 于 对 社会 经 济 运行 的 结果 进行 比较 、 评 估 和 考核 ,以 检查 工作 质量 或 其 他 
定额 指标 的 结合 作用 。 包 括 国民 经 济 评价 指标 和 企业 经 济 活动 评价 指标 。 

预警 指标 一 般 是 用 于 对 宏观 经 济 运行 进行 监测 ,对 国民 经 济 运行 中 即将 发 生 的 失衡 、 失 
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控 等 进行 预报 、 和 警示。 通常 选择 国民 经 济 运行 中 的 关键 性 、 敏 感性 经 济 现 象 ,建立 相应 的 监 
测 指标 体系 。 


Ẹ 标志 与 指标 的 关系 


标志 是 说 明 总 体 单位 特征 的 ,而 指标 是 说 明 总 体 特征 的 ;指标 都 能 用 数值 表示 ,而 标志 
中 的 品质 标志 是 用 属性 表示 的 ;指标 数值 是 经 过 一 定 的 汇总 取得 的 ,而 标志 中 的 数量 标志 不 
一 定 经 过 汇总 ,可 直接 取得 ;标志 一 般 不 具备 时 间 地 点 等 条 件 限制 ,但 作为 一 个 完整 的 统计 
指标 ,一 定 要 讲 时 间 、 地 点 、 范 围 。 有 许多 统计 指标 的 数量 值 是 从 总 体 单位 的 数量 标志 值 汇 
总 而 来 的 。 两 者 存在 着 一 定 的 变换 关系 (由 于 研究 的 目的 不 同 ,原来 的 统计 总 体 如 果 变 成 了 
总 体 单位 , 则 相应 的 统计 指标 也 就 变 成 了 数量 指标 ) 。 


1.3 数据 的 测量 尺度 与 类 型 


1.3.1 数据 的 测量 尺度 


搜集 的 数据 需要 按 下 列 测量 尺度 来 度量 : 定 类 尺度 、 定 序 尺度 、 定 距 尺度 和 定 比 尺度 。 

(1) 定 类 尺度 。 对 数据 类 别 或 属性 的 一 种 测度 。 特 点 是 其 值 只 能 代表 事物 的 类 别 和 属 
性 ,不 能 比较 各 类 别 之 间 的 大 小 。 所 以 各 类 别 之 间 没 有 顺序 或 者 等 级 ,一般 以 字符 ,文字 

例如 ,国民 经 济 按 其 经 济 类 型 ,可 以 分 为 国有 经 济 、 集 体 经 济 、 私 营 经 济 个 体 经 济 等 类 ， 
并 用 (01) 代 码 表示 国有 经 济 ,(02) 表 示 集 体 经 济 ,(03) 表 示 私 营 经 济 , (04) 表 示 个 体 经 济 。 
并 且 用 (011) 代 表 国 有 经 济 中 的 国有 企业 , (012) 代 表 国 有 联营 企业 ;用 (021) 表 示 集 体 经 济 
中 集体 企业 ,(022) 表 示 集 体 联营 企业 ;用 (031) 表 示 私 营 经 济 中 的 私营 独资 企业 ,(032) 表 示 
私人 合伙 企业 ,(033) 表 示 私 车 有 限 责任 公司 ;用 (041) 表 示 个 体 经 济 中 的 个 体 工商 户 , (042) 
表示 个 人 合伙 等 。 其 中 两 位 代码 表示 经 济 大 类 ,而 三 位 代码 则 表示 各 类 中 的 构成 。 不 同 代 
码 反 映 同 一 水 平 的 各 类 (组 ) 别 ,并 不 反映 其 大 小 顺序 。 各 类 中 虽然 可 以 计算 它 的 单位 数 ,但 
不 能 反映 第 一 类 的 一 个 单位 可 以 相当 于 第 二 类 的 几 个 单位 ,等 等 。 

上 述 实例 中 应 用 了 数字 代码 ,但 此 时 的 测量 尺度 仍 是 定 类 尺度 。 使 用 定 类 变量 对 事物 
进行 分 类 ,必须 符合 穷尽 和 互 斥 原则 。 穷 尽 就 是 每 个 个 体 都 能 归 为 一 个 类 别 , 互 斥 就 是 每 个 
个 体 只 能 归 为 一 个 类 别 。 

(2) 定 序 尺度 。 对 数据 之 间 等 级 或 者 顺序 的 一 种 测度 。 其 计算 结果 只 能 排序 ,不 能 进 
行 算术 运算 。 这 类 数据 具有 定 类 数据 的 性 质 ,并 且 数 据 的 顺序 或 等 级 的 意义 明确 ,这 类 数据 
的 测量 尺度 就 是 定 序 尺 度 。 这 种 尺度 的 主要 数学 特征 是 二 ”或 “二 ”。 

例如 ,对 合格 产品 按 其 性 能 和 好 坏 ,分 成 优等 品 .一 等 品 、 合 格 品 等 。 这 种 尺度 虽然 也 不 
能 表明 一 个 单位 一 等 品 等 于 几 个 单位 二 等 品 , 但 却 明确 表示 一 等 品 性 能 高 于 二 等 品 ,而 二 等 


品 性 能 又 高 于 三 等 品 等 。 
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定 序 尺度 除了 用 于 分 类 (组 ) 外 ,在 对 定 序数 据 的 分 析 中 还 可 以 确定 中 位 数 、 四 分 位 数 、 
众 数 等 指标 的 位 置 。 

(3) 定 距 尺度 . 对 数据 次 序 之 间 间 距 的 测度 。 其 特点 为 不 仅 能 够 对 数据 进行 排序 ,还 能 
准确 计算 之 间 的 差距 是 多 少 。 生 活 中 最 典型 的 定 距 尺度 是 温度 计 。 定 距 尺 度 可 以 用 众 数 、 
中 位 数 或 者 算术 平均 值 来 描述 ,数据 具有 顺序 数据 的 性 质 , 测 量 结果 表现 为 数值 ,可 以 进行 
加 或 减 的 运算 。 

例如 ,学 生 某 门 课程 的 考分 ,可 以 从 高 到 低 分 类 排序 ,形成 90 分 .80 分 .70 分 ,直到 零 分 
的 序列 。 这 个 数列 不 仅 有 明确 的 高 低 之 分 ,而 且 可 以 计算 差距 ,90 分 比 80 分 高 10 分 , 比 70 
分 高 20 分 等 。 

(4) 定 比 尺度 。 对 两 个 观测 值 之 间 比 值 的 一 种 测度 。 定 比 尺度 与 定 距 尺度 最 大 区 别 是 
有 一 固定 的 绝对 * 零 点 ”, 而 定 距 尺 度 没 有 。 定 距 变 量 中 *0? 不 表示 没有 ,只 是 一 个 测量 值 ;而 
定 比 变量 中 “0” 就 是 表示 没有 。 定 比 尺度 的 主要 数学 特征 是 可 以 进行 乘 或 除 的 运算 。 

例如 ,将 某 地 区 人 口 数 和 土地 面积 对 比 计算 人 口 密度 指标 ,说 明 人 口 相 对 的 密集 程度 。 
甲 地 区 人 口 可 能 比 乙 地 区 多 ,但 甲 地 区 的 土地 更 广阔 .用 人 口 密 度 指标 就 可 以 说 明 甲 地 区 人 
口 不 是 多 而 是 少 。 又 如 将 一 个 国家 (地 区 ) 的 国内 生产 总 值 与 该 国 (地 区 ) 居 民 数 对 比 ,计算 
人 均 国 内 生产 总 值 ,可 以 反映 国家 (地 区 ) 的 综合 经 济 能 力 。 


P 1.3.2 统计 数据 类 型 


(1. 分 类 型 数据 和 数量 型 数据 


按照 所 采用 的 计量 尺度 不 同 , 可 以 将 统计 数据 分 为 分 类 数据 、 顺 序数 据 和 数值 型 数据 。 

归属 于 某 一 类 别 的 数据 称 为 分 类 型 数据 (categorical data) ,其 结果 均 表现 为 类 别 , 也 称 
为 品质 数据 (quality data). 

描述 现象 的 数量 .大 小 或 多 少 的 数据 称 为 数量 型 数据 (quantitative data) ,由 于 定 距 尺 度 
和 定 比 尺度 属于 同一 测量 层次 ,所 以 可 以 把 后 两 种 尺度 测度 的 数据 看 作 是 同一 类 数据 ,统称 
为 定量 数据 或 数值 型 数据 。 数 值 型 数据 可 能 是 离散 的 ,也 可 能 是 连续 的 ,在 一 定 区 间 内 可 以 
任意 取 值 的 变量 叫 连续 型 变量 。 其 数值 是 连续 不 断 的 , 相 邻 两 个 数值 可 作 无 限 分 割 , 即 可取 
无 限 个 数值 。 例 如 ,生产 零件 的 规格 尺寸 人体 测 量 的 身高 体重 .胸围 等 为 连续 型 变量 ,其 
数值 只 能 用 测量 或 计量 的 方法 取得 。 如 果 数 值 只 能 用 自然 数 或 整数 单位 计算 的 则 为 离散 型 
变量 。 例 如 ,企业 个 数 、. 职 工人 数 .设备 台 数 等 只 能 按 计量 单位 数 计数 ,这 种 变量 的 数值 一 般 
用 计数 方法 取得 。 

区 分 测量 的 层次 和 数据 的 类 型 十 分 重要 ,因为 对 不 同类 型 的 数据 将 采用 不 同 的 统计 方 
法 来 处 理 和 分 析 。 既 有 适用 于 低层 次 测量 数据 的 统计 方法 ,也 有 适用 于 较 高 层次 的 测量 数 
据 , 因 为 后 者 具有 前 者 的 数学 特性 。 比 如 :在 描述 数据 的 集中 趋势 时 ,对 分 类 型 数据 通常 是 
计算 众 数 ;反之 ,适用 于 高 层次 测量 数据 的 统计 方法 , 则 不 能 用 于 较 低层 次 的 测量 数据 ,因为 
低层 次 数据 不 具有 高 层次 测量 数据 的 数学 特性 。 比 如 ,测度 数量 型 数据 可 以 计算 平均 数 , 但 
对 于 分 类 型 数据 则 不 能 计算 平均 数 。 
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E 截面 数据 和 时 间 序列 数据 


截面 数据 (cross section data) 是 在 同一 时 间 和 时 点 上 搜集 的 数据 。 截 面 数据 是 按照 统 
计 单 位 排列 。 截 面 数 据 不 要 求 统计 对 象 及 其 范围 相同 ,但 要 求 统 计 的 时 间 相 同 。 也 就 是 说 
必须 是 同一 时 间 截 面 上 的 数据 。 表 1-1 中 的 数据 是 截面 数据 ,因为 它 描述 了 上 市 公司 行业 
分 类 的 多 个 变量 在 同一 时 间 上 的 情况 。 

时 间 序 列 数 据 (time series data) 是 在 不 同时 点 上 搜集 的 数据 。 

图 1-1 是 2017 年 1 月 ~2018 年 10 月 居民 消费 价格 指数 曲线 。 我 们 注意 到 ,三 项 指数 
在 2018 年 2 月 达到 最 高 ,表明 在 当月 物价 水 平 上 涨 较 快 ;2017 年 2 月 急剧 下 降 ,物价 水 平 处 
在 低谷 。 在 经 济 统计 和 各 种 出 版 物 中 ,我 们 经 常 可 以 看 到 时 间 序 列 图 形 , 这 些 图 形 帮助 人 们 
了 解 过 去 发 生 的 情况 ,分析 现象 随时 间 变 化 的 趋势 和 规律 ,推测 时 间 序 列 的 未 来 发 展 水 平 。 

一 一 居民 消费 价格 指数 (上 年 同月 =100) 


103.57 。。。 城市 居民 消费 价格 指数 〔 上 年 同月 =100) 
一 “农村 居民 消费 价格 指数 〈 上 年 同月 =100) 
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图 1-1 居民 消费 价格 指数 
资料 来 源 :国家 统计 局 ,2018. 12. 


1.4 ”数据 统计 分 析 方 法 


b 1.4.1 描述 统计 
为 了 使 统计 数据 更 易于 理解 ,一般 采取 表格 .图形 或 数值 的 形式 汇总 数据 的 统计 方法 称 


为 描述 统计 (descriptive statistics) 。 描 述 统计 是 统计 研究 的 基础 , 它 为 推断 统计 、 咨 询 和 决 
策 提 供 了 必要 的 事实 依据 。 
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用 描述 统计 的 方法 对 表 1-1 中 部 分 行业 的 上 市 公司 平均 市 一 率 数据 进行 分 析 , 如 图 1-2 
是 数据 集 的 条 形 图 。 通 过 数据 统计 图 形 , 使 数据 更 容易 分 析 和 解释 。 从 图 1-2 中 ,我 们 很 容 
易 获 得 这 样 的 一 些 信息 ,有 一 些 行业 平均 市 鱼 率 相对 于 公司 数量 而 言 是 偏 高 的 ,而 有 一 些 行 
业 偏 低 ,理财 顾问 和 投资 者 通过 这 些 数 据 的 分 析 ,很 容易 找到 某 一 个 行业 哪些 上 市 公司 估 值 
偏 高 了 ,哪些 公司 的 估 值 偏 低 , 进 而 做 出 投资 决策 。 


200 70 
60 
150 50 
40 
100 国生 上 市 公司 数 呈 
30 i AS TH 
一 — aA 
50 20 
目 E : 
0 = — mm | 
SHARP PA AAA HP aa aA aA ee eH do 
BERRA RK KEL ERE KH EE 
KE RMR SEHK EGR Ree AR 
x & RREK RRX BS HE 
A i REER ERREK RE 
% j 8 oO 4B EKRE At 
A % , E ERSE A, 
x R 每 «& ABES 2 
Yr No å È +R, x 
Š a X TER 
i R : , 
R 每 z E 
# È 关 E 
图 1-2 上 市 公司 行业 市 盈 率 条 形 图 


我 们 可 以 在 各 种 类 型 的 经 济 报道 ,商务 出 版 物 中 看 到 图 1-2 这 样 的 数据 分 析 图 形 的 
应 用 。 


> 1.4.2 推 类 统计 


在 统计 研究 中 ,我 们 需要 有 关 研 究 对 象 的 全 部 数据 信息 ,出 于 对 时 间 、 成 本 和 其 他 因素 
的 考虑 ,只 能 搜集 到 研究 对 象 的 一 部 分 数据 。 在 特定 研究 中 我 们 把 从 全 部 总 体 中 搜集 的 一 
部 分 个 体 称 为 样本 (sample) 。 而 利用 样本 数据 对 总 体 特 征 进行 估计 和 推断 ,并 做 出 假设 检 
验 的 过 程 被 称 为 推断 统计 (statistical inference) 。 推 断 统计 是 统计 学 的 基本 方法 ,在 统计 研 
究 中 得 到 了 极为 广泛 的 应 用 。 

作为 推断 统计 的 一 个 例子 ,我 们 考察 由 西门 子 电气 公司 所 作 的 一 项 研究 。 西 门 子 电气 
公司 生产 一 种 广泛 应 用 于 一 些 电气 设备 的 高 亮度 灯泡 。 为 了 提高 灯泡 的 使 用 寿命 ,产品 研 
发 部 门 开发 出 一 种 新 型 灯丝 的 灯泡 。 在 该 项 研究 中 ,我 们 把 总 体 定 义 为 全 部 的 使 用 新 型 灯 
丝 生 产 的 灯泡 。 为 了 估计 新 灯丝 的 优点 ,抽取 了 200 只 新 灯丝 灯泡 组 成 样本 ,并 进行 了 测 
试 , 记 录 每 只 灯泡 灯丝 被 烧 断 之 前 的 时 间 ,样本 数据 见 表 1-2。 
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表 1 2 西门 子 电气 公司 200 只 灯泡 样本 的 使 用 寿命 单位 :小 时 
107 73 68 97 76 79 94 59 98 57 
54 65 71 70 84 88 62 61 79 98 
66 62 79 86 68 74 61 82 65 98 
62 116 65 88 64 79 78 79 77 86 
74 85 73 80 68 78 89 72 58 69 
92 78 88 vig 103 88 63 68 88 81 
75 90 62 89 11 71 74 70 74 70 
65 81 75 62 94 71 85 84 83 63 
81 62 79 83 93 61 65 62 92 65 
83 70 70 81 77 72 84 67 59 58 
78 66 66 94 77 63 66 15 68 76 
90 78 71 101 78 43 59 67 61 71 
96 75 64 76 72 77 74 65 82 86 
66 86 96 89 81 71 85 99 59 92 
68 72 77 60 87 84 75 ee 51 45 
85 67 87 80 84 93 69 76 89 75 
83 68 72 67 92 89 82 96 77 102 
74 91 76 83 66 68 61 73 72 76 
73 77 79 94 63 59 62 ?1 81 65 
73 63 63 89 82 64 85 92 64 73 

假设 西门 子 电 气 公 司 希 望 利用 样本 

1 Beea Peles ni 数据 对 全 部 新 型 灯泡 总 体 的 平均 寿命 进 

寿命 未 知 ” 灯丝 的 灯泡 行 推断 ,以 确认 所 有 产品 的 质量 是 否 合 


格 。 基 本 的 思路 是 将 表 1-2 所 有 数据 相 加 
再 除 以 200, 可 得 到 灯泡 样本 数据 的 平均 
«gutta rune ree ess oe | 使 用 寿命 为 76 小 时 。 我 们 同样 可 以 利用 

用 寿命 为 76 小 时 这 一 样本 结果 估计 灯泡 总 体 的 平均 使 用 
1-3 新 型 灯泡 平均 使 用 寿命 推断 统计 的 过 程 寿命 也 是 76 小 时 。 西 门 子 电气 公司 灯泡 
平均 使 用 寿命 推断 统计 的 基本 过 程 如 图 


1-3 所 示 。 

利用 样本 数据 对 我 们 感 兴 趣 的 总 体 特 征 进行 估计 时 ,还 要 考虑 估计 的 质量 和 精确 性 。 
以 西门 子 电 气 为 例 ,研究 人 员 可 能 指出 ,新 灯泡 的 平均 使 用 寿命 的 点 估计 值 是 76 小 时 ,误差 
的 边际 是 士 6 小 时 ,这 样 ,新 灯泡 的 总 体 平均 使 用 寿命 的 区 间 估 计 是 70 一 82 小 时 ,在 这 个 估 
值 区 间 内 ,还 可 以 给 出 有 多 大 的 比例 包含 了 总 体 平均 数 。 


o— 


统计 学 基础 (第 二 版 ) 


| 


Gir ] 5 大 数据 与 数据 挖掘 


如 今 , 许 多 的 商业 机 构 每 天 都 可 以 获取 大 量 的 基础 数据 ,即使 一 个 触摸 屏 或 是 某 一 个 显 
示 终 端 处 理 过 的 订单 、 某 一 笔会 计 业 务 ,我们 都 不 能 忽视 其 数据 的 意义 。 对 于 大 型 的 零售 公 
司 、 网 络 的 销售 卖家 等 商业 机 构 ,搜集 数据 的 目的 不 仅 是 利用 这 些 数据 来 改善 商业 目标 。 如 
何 有 效 地 使 用 这 些 数据 ,也 需要 由 专业 研究 人 员 来 完成 。 

数据 挖掘 (data mining) 是 研究 从 非常 大 的 数据 库 中 开发 出 有 用 的 决策 信息 的 方法 。 一 
般 是 指 从 大 量 的 数据 中 自动 搜索 隐藏 于 其 中 的 有 着 特殊 联系 的 信息 的 过 程 ,并 通过 统计 、 在 
线 分 析 处 理 、 情 报 检索 和 模式 识别 等 诸多 方法 来 实现 上 述 目标 。 

啤酒 与 尿布 。 全 球 零 售 业 巨头 沃尔玛 在 对 消费 者 购物 行为 分 析 时 发 现 ,男性 顾客 在 购 
买 婴 儿 尿 片 时 ,常常 会 顺便 搭配 几 瓶 啤酒 来 炉 劳 自己 ,于 是 尝试 推出 了 将 啤酒 和 尿布 摆 在 一 
起 的 促销 手段 。 没 想到 这 个 举措 居然 使 尿布 和 啤酒 的 销量 都 大 幅 增 加 了 。 如 今 ,“ 啤 酒 十 尿 
布 ” 的 数据 分 析 成 果 早 已 成 了 数据 挖掘 应 用 的 经 典 案 例 , 被 人 津津 乐 道 。 

Google 成 功 预 测 冬 季 流 感 。2009 年 ,Google 通过 分 析 5 000 万 条 美国 人 最 频繁 检索 的 
词汇 ,将 之 和 美国 疾病 中 心 在 2003 年 到 2008 年 间 季节 性 流感 传播 时 期 的 数据 进行 比较 ,并 
建立 一 个 特定 的 数学 模型 。 最 终 Google 成 功 预测 了 2009 冬季 流感 的 传播 ,甚至 可 以 具体 
到 特定 的 州 和 地 区 。 

通过 大 数据 与 乔布斯 癌症 治疗 。 乔 布 斯 是 世界 上 第 一 个 对 自身 所 有 DNA 和 肿瘤 DNA 进 
行 排序 的 人 。 为 此 ,他 支付 了 高 达 几 十 万 美元 的 费用 。 他 得 到 的 不 是 样本 ,而 是 包括 整个 基因 
的 数据 文档 。 医 生 按 照 所 有 基因 按 需 下 药 ,最 终 这 种 方式 帮助 乔布斯 延长 了 好 几 年 的 生命 。 

微软 大 数据 成 功 预测 奥斯卡 21 项 大 奖 。2013 年 ,微软 纽约 研究 院 的 经 济 学 家 David 利 
用 大 数据 成 功 预测 24 个 奥斯卡 奖项 中 的 19 个 ,成 为 人 们 津津 乐 道 的 话题 。 今 年 他 再 接 再 
厉 ,成 功 预测 第 86 届 奥 斯 卡 金 像 奖 颁奖 典礼 24 个 奖项 中 的 21 个 ,继续 向 人 们 展示 现代 科 
技 的 神奇 魔力 。 

通过 这 些 有 趣 的 数据 挖掘 案例 ,你 会 发 现 * 数 据 ? 其 实 就 在 我 们 的 身边 。 对 数据 进行 控 
掘 分 析 正 在 颠覆 每 一 种 类 型 的 企业 的 认 知 。 位 于 纽约 长 岛 的 文艺 复兴 科技 公司 (Renais- 
sance Technologies) 所 管理 的 对 冲 基金 ,有 150 亿美 元 的 资产 。 这 家 公司 或 许 是 20 年 来 业 
绩 最 佳 的 对 冲 基 金 ,而 领导 这 家 公司 的 是 两 名 来 自 IBM 人 工 智 能 实验 室 的 科学 家 ,他 们 开 
发 了 许多 数学 模型 用 来 进行 分 析 和 交易 ,这 些 模型 都 是 建立 在 海量 数据 基础 上 的 ,具有 可 靠 
性 并 可 进行 实际 预测 ,而 最 后 的 结果 往往 与 他 们 预想 的 一 样 。 

数据 挖掘 是 一 门 非常 依赖 于 统计 方法 的 科学 , 它 创 造 性 地 综合 了 所 有 这 些 方法 ,以 及 人 
工 智能 .机 器 学 习 等 计算 机 技术 ,从 而 使 数据 挖掘 更 有 效 。 当 然 , 数 据 挖掘 不 仅仅 局 限于 此 ， 
它 还 有 更 为 广阔 复杂 的 应 用 领域 ,有 待 于 科学 家 的 不 断 探索 。 

区 别 于 传统 的 数据 类 型 ,它们 呈现 出 了 新 的 特点 。 

CL) 过 去 一 些 记录 是 以 模拟 形式 存在 的 ,或 者 以 数据 形式 存在 但 是 存 贮 在 本 地 ,不 是 公 
开 数 据 资源 ,没有 开放 给 互联 网 用 户 , 例 如 音乐 .照片 .视频 ,监控 录像 等 影音 资料 。 现 在 这 
些 数 据 不 但 数据 量 巨 大 .并且 共享 到 了 互联 网 上 ., 面 对 所 有 互联 网 用 户 , 其 数量 之 大 是 前 所 
未 有 。 例 如 ,Facebook 每 天 有 18 亿 张 照片 被 上 传 或 被 传播 ,形成 了 海量 的 数据 。 
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(2) 移动 互联 网 出 现 后 ,移动 设备 的 很 多 传感器 收集 了 大 量 的 用 户 单 击 行为 数据 ,它们 
每 天 产生 了 大 量 的 单 击 数据 ,这 些 数据 被 某 些 公司 拥有 ,形成 大 量 用 户 行为 数据 。 

(3) 电子 地 图 如 高 德 .百度 、Google 地 图 出 现 后 ,产生 了 大 量 的 流 数 据 , 这 些 数据 不 同 于 
传统 数据 。 传 统 数据 代表 一 个 属性 或 一 个 度量 值 , 但 是 这 些 地 图 产生 的 流 数 据 代 表 着 一 种 
行为 一 种 习惯 ,这 些 流 数据 经 频率 分 析 后 会 产生 巨大 的 商业 价值 。 基 于 地 图 产生 的 流 数据 
是 一 种 新 型 的 数据 类 型 ,在 过 去 是 不 存在 的 。 

(A) 进入 了 社交 网 络 的 年 代 后 ,互联 网 行为 主要 由 用 户 参与 创造 ,大 量 的 互联 网 用 户 创 
造 出 海量 的 社交 行为 数据 ,这 些 数 据 是 过 去 未 曾 出 现 的 。 其 揭示 了 人 们 行为 特点 和 生活 
习惯 。 

O 电 商 平台 产生 了 大 量 网 上 交易 数据 ,包含 支付 数据 ,查询 行为 ,物流 和 运输、 购买 嘉 
好 、 单 击 顺序 ,评价 行为 等 ,这 构成 了 信息 流 和 资金 流 数据 。 

(6) 传统 的 互联 网 人 口 转向 搜索 引擎 之 后 ,用 户 的 搜索 行为 和 提问 行为 聚集 了 海量 数 
据 。 单 位 存储 价格 的 下 降 也 为 存储 这 些 数据 提供 了 经 济 上 的 可 能 。 


dp 


统计 是 搜集 ,分 析 、 表 述 和 解释 数据 的 科学 。 几 乎 每 个 商务 和 经 济 专 业 的 大 学 生 都 要 学 
习 统 计 学 课程 。 我 们 以 描写 商务 和 经 济 中 典型 的 统计 应 用 开始 本 章 的 论述 。 

数据 是 搜集 和 分 析 的 事实 和 数字 。 可 以 用 四 种 测量 尺度 来 测度 一 个 特定 变量 的 数据 ， 
他 们 是 定 类 尺度 ,顺序 尺度 、 定 距 尺 度 和 定 比 尺度 。 

为 了 统计 分 析 的 目的 ,数据 分 为 分 类 数据 ,顺序 数据 和 数值 型 数据 。 分 类 型 数据 用 标记 
或 名 称 来 识别 每 个 个 体 的 属性 。 分 类 型 数据 既 可 以 用 定 类 尺度 也 可 以 用 顺序 尺度 度量 。 数 
值 型 数据 表示 数据 大 小 和 多 少 的 数值 。 数 值 型 数据 既 可 以 用 定 距 尺度 也 可 以 用 定 比 尺度 度 
量 。 只 有 当 数 据 是 数值 型 的 ,普通 的 数学 运算 才 有 意义 。 

根据 数据 获取 的 时 间 点 的 不 同 , 数 据 可 分 为 截面 数据 和 时 间 序 列 数 据 。 在 同一 时 间 和 
时 点 上 搜集 的 数据 称 为 截面 数据 ,常用 于 数据 的 横向 比较 ;在 不 同时 点 上 搜集 的 数据 称 为 时 
间 序 列 数据 ,常用 于 描述 观察 对 象 的 纵向 发 展 过 程 。 

本 项 目 中 介绍 了 统计 学 的 一 些 基 本 概念 ,如 总 体 、 个 体 、 样 本 ,变量 .参数 等 ,这 些 概 念 的 
理解 ,有 助 于 我 们 以 后 的 统计 学 课程 的 学 习 。 描 述 统计 和 推断 统计 是 统计 分 析 的 主要 方法 ， 
描述 统计 通常 使 用 可 视 化 的 图 表 等 方法 展示 数据 意义 的 方法 ,受到 大 家 的 关注 。 推 断 统计 
是 统计 学 的 一 个 重要 贡献 , 它 是 通过 样本 数据 来 推断 总 体 特征 的 统计 方法 。 

在 统计 学 习 中 ,建议 尽 可 能 地 使 用 计算 机 等 统计 分 析 工 具 , 使 我 们 的 统计 分 析 工 作 更 有 
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1. 能 源 部 提供 了 市 场 上 销售 的 乘 用 车 燃油 消耗 的 信息 , 表 1-3 是 由 10 辆 汽车 组 成 的 一 
个 样本 。 数 据 有 汽车 类 型 ,发 动机 汽缸 数 ,城市 每 公里 燃油 消耗 量 公 路 行驶 每 公里 消耗 量 ， 


以 及 推荐 使 用 的 燃料 。 
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表 1-3 10 种 乘 用 车 燃料 消耗 信息 单位 : 升 / 公 里 

奥迪 A8 大 型 12 18 17 优质 汽 汪 
宝马 小 型 6 17 15 优质 汽 汪 
凯迪 拉克 中 型 6 15 13 普通 汽 济 
克莱斯勒 大 型 8 16 14 优质 汽 济 
福特 福克斯 小 型 4 10 10 普通 汽 济 
现代 伊兰特 中 型 4 13 12 普通 汽 济 
吉普 切诺基 中 型 6 16 15 柴油 

沃尔沃 小 型 6 18 15 Mag Ud 
丰田 凯美瑞 中 型 4 15 13 普通 汽 洲 
大 众 捷达 小 型 5 10 8 普通 汽 洲 


(1) 这 个 数据 集 有 几 个 个 体 ? 

(2) 这 个 数据 集 有 几 个 变量 ? 

(3) 哪些 变量 是 分 类 变量 ,哪些 是 数量 变量 ? 

(4) 每 个 变量 使 用 的 是 哪 种 类 型 的 测量 尺度 ? 

2. 就 业 管理 部 门 对 即将 毕业 的 大 学 生 进 行 了 一 次 就 业 意向 的 调查 ,提出 的 问题 如 下 : 
(1) 您 的 性 别 ? 

(2) 您 的 年 龄 是 多 少 ? 

(3) 你 希望 在 哪个 城市 就 业 ? 

(4) 你 首选 的 就 业 方 向 是 什么 ? 

(5) 你 期 望 的 月 薪 是 多 少 ? 

上 述 每 一 个 问题 回答 的 数据 是 分 类 型 数据 还 是 数量 型 数据 ? 并 说 明 适 合 每 一 个 数据 的 


测量 尺度 。 


3. 5 名 学 生 统 计 学 期 中 考试 成 绩 的 样本 如 下 :72、65、82、90、76, 请 分 析 下 列 的 表述 哪 一 


个 是 正确 的 ,说 明 其 理由 。 


a 
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(1) 5 名 学 生 的 平均 考试 成 绩 是 77。 

(2) 参加 考试 所 有 学 生 的 平均 考试 成 绩 是 77。 

(3) 参加 考试 的 所 有 学 生 的 平均 考试 成 绩 的 估计 值 是 77。 

(4) 一 半 以 上 参加 期 中 考试 的 学 生 的 成 绩 在 70 一 85 之 间 。 

(5) 如 果 这 个 样本 中 还 包括 其 他 5 名 学 生 ,他 们 的 成 绩 将 在 65~90 之 间 。 
4. 旅游 公司 给 客户 发 放 了 一 张 调查 表 , 收 集 他 们 的 旅游 的 意向 ,下 列 问题 是 问卷 中 15 
问题 中 的 一 部 分 。 

CL) 我 安排 的 出 行 时 间 一 般 在 :五 一 前 后 ,十 一 前 后 .…… 

(2) 此 行 是 我 的 第 几 次 外 出 旅行 :第 1 次 ,第 2 次 ,第 3 次 ,第 4 次 ,…… 
G) 我 计划 安排 的 时 间 是 :3 天 ,5 天 ，…… 

(4) 我 预计 的 支出 可 能 是 :具体 的 支出 费用 的 选项 。 
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(5) 我 计划 住宿 地 点 :酒店 、 青 年 公寓 ,同学 朋友 处 .亲戚 家 ,……… 

(6) 在 旅游 目的 地 逗留 的 天 数 。 

(7) 最 感 兴趣 的 旅游 目的 地 。 

(8) 可 能 乘坐 的 交通 工具 主要 是 :火车 ,飞机 ，…… 

试问 ， 

(1) 研究 的 总 体 是 什么 ? 

(2) 对 客户 总 体 ,用 问卷 调查 是 一 个 好 方法 吗 ? 

(3) 对 上 述 问题 搜集 的 数据 ,哪些 是 分 类 型 数据 ?哪些 是 数值 型 数据 ?说 明 其 理由 。 
5. 表 1-4 是 交通 部 门 发 布 的 1998 一 2011 年 分 类 客运 统计 数据 表 。 


表 1-4 1998 一 2011 年 客运 量 统计 表 单位 :万 人 
年 份 公路 客运 量 水 运 客 运 量 民用 航空 客运 量 
1998 1 257 332 20 545 5755 
1999 1 269 004 19 151 6 094 
2000 1 347 392 19 386 6 722 
2001 1 402 798 18 645 7 524 
2002 1 475 257 18 693 8 594 
2003 1 464 335 17 142 8 759 
2004 1 624 526 19 040 12 123 
2005 1 697 381 20 227 13 827 
2006 1 860 487 22 047 15 968 
2007 2 050 680 22 835 18 576 
2008 2 682 114 20 334 19 251 
2009 2 779 081 22 314 23 052 
2010 3 052 738 22 392 26 769 
2011 3 286 220 24 556 29 317 


(1) 绘制 表 1-4 客运 量 的 时 间 序 列表 。 分 不 同 表 显示 三 类 客运 量 的 时 间 序 列 。 

(2) 通过 时 间 序 列 图 显示 哪 种 方式 是 人 们 出 行 方式 的 首选 ? 为 什么 ? 

(3) 用 2011 年 的 数据 比较 公路 \ 水 运 、 民 航 客运 数量 ,并 绘制 条 形 图 。 这 张 图 表 是 以 截 
面 数 据 为 依据 还 是 以 时 间 序 列 数据 为 依据 ? 
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>>> | 实践 中 的 统计 
当代 青年 群体 婚恋 观 调 查 


团 中 央 “ 青 年 之 声 ” 近 日 发 布 了 《当代 青年 群体 婚恋 观 调查 报告 ), 报 告 从 “青年 择偶 观 、 
恋爱 观 、 婚 姻 观 、 生 育 观 、 婚 恋 伦理 观 及 对 团 组 织 开展 的 青年 婚恋 服务 活动 的 看 法 ”六 个 方面 
对 青年 婚恋 观 进行 了 调查 。 调 查 依 托 “ 青 年 之 声 ” 平 台 , 在 全 国 范围 内 开展 (怎样 让 青年 更 幸 
福 》 青 年 群体 婚恋 观 调查 活动 。 以 “19 至 35 岁 ” 人 和 群 为 主 进行 了 抽样 调查 ,通过 各 级 团 组 织 
渠道 ,依据 科学 抽样 原则 ,在 不 同 区 域 . 不 同 领 域 的 青年 中 发 放 调 查 问 卷 ,最 终 获 得 有 效 问 卷 
3 082 份 。 其 中 ,男性 占 比 42. 96%, 女 性 占 比 57.04%。 单 身 青年 占 比 51. 52% ,已 婚 青年 占 
比 26. 51% ,恋爱 中 的 青年 占 比 21.97%。84. 33 史 的 青年 为 大 专 以 上 ( 含 大 学 ) 学 历 , 硕 士 研 
究 生 及 以 上 学 历 占 10. 29%。 直 辖 市 青年 占 14. 11%、 省 会 城市 青年 占 12.07%. WATA 
县 级 市 青年 占 50. 46%、 乡 镇 村 青年 占 23.36%, 

调查 结果 显示 ,青年 择偶 更 注重 “内 在 的 匹配 度 ”, 近 七 成 青年 择偶 
“ 愿 等 待 不 愿 将 就 "。 从 整体 上 看 ,“ 人 品 ” 和 “性 格 ” 是 青年 择偶 时 最 为 看 
重 的 两 个 方面 。 最 看 重 人 品 的 占 比 达 84.9%, 最 看 重 性 格 的 占 比 达 
71. 22%。 其 次 ,50.15% 的 男性 青年 认为 “相貌 ”较为 重要 ,而 54.89% 4 
女性 青年 则 更 注重 "能 力 ”。 此 外 ,健康 ”和 “能 力 ” 也 是 男女 青年 都 比较 
注重 的 方面 。 相 对 比 传统 观念 中 的 “门当户对 ”, 当代 青 年 择偶 呈现 更 加 
多 元 化 特点 ,更 注重 “内 在 的 匹配 度 ”。 

在 本 次 调查 中 ,有 60.22% 的 青年 认为 “与 陌生 人 网 恋 不 靠 谱 ”,25.41% 的 青年 认为 * 抱 
着 试 一 试 的 态度 可 以 尝试 网 恋 ”,14. 37% 的 青年 认为 “可 以 接受 网 恋 ”。 在 青年 恋爱 观 方面 ， 
七 成 以 上 男性 青年 会 主动 追求 爱情 , 女 青年 中 主动 追求 的 仅 三 成 多 。 对 于 青年 单身 现象 的 
原因 ,交际 圈 小 、 工 作 忙 和 不 主动 是 受 访 者 选择 的 三 大 主要 原因 。 另 有 近 半 数 青年 表示 ,“ 不 
够 积极 主动 ,不 知道 该 如 何 与 异性 相处 ”。 

在 本 次 调查 中 ,有 81.47% 的 青年 认为 “事业 和 家 庭 都 重要 ”; 当代 青年 对 工作 和 家 庭 都 
很 看 重 , 男 性 青年 对 家 庭 的 重视 度 比 女 性 青年 略 高 。 本 次 调查 中 ,49. 55% 的 青年 表示 单身 
期 间 感 受到 的 最 大 压力 来 自 于 家人”, 第 二 是 “社会 与 论 ”, 第 三 是 “自我 压力 ”。“ 催 婚 ” 已 成 
为 代 际 关系 紧张 的 重要 因素 。 

调查 显示 ,多 数 青年 认为 “夫妻 和 孩子 生活 在 一 起 ”的 “传统 家 庭 ? 是 “最 期 待 的 家 庭 模 
式 ”, 仅 有 6.26% 的 青年 选择 “丁克 家 庭 "。 可 见 , 中 国 传统 的 生育 观 依然 备 受 青年 支持 。 在 
全 面 “二 孩 ” 的 政策 背景 下 , 近 六 成 青年 表示 希望 生育 2 个 小 孩 。 此 外 ,59.31% 的 青年 表示 
婚 后 两 年 内 要 孩子 。 

以 上 数据 是 如 何 收集 的 ? 受 访 对 象 提供 的 数据 是 否 客观 、 真 实 ? 数据 描述 的 事实 是 否 
TE? 回答 上 述 问题 ,我 们 需要 具备 一 些 关于 社会 调查 的 知识 和 方法 。 

在 社会 生活 中 ,我们 经 常会 遇 到 各 种 类 似 的 提问 ,比如 ,你 更 喜欢 什么 类 型 的 电视 
节目 ? 购买 住房 时 优先 考虑 大 户型 还 是 小 户型 ? 孝敬 父母 和 子女 的 性 别 有 关 系 吗 ? 你 
对 公司 的 福利 政策 是 否 满意 ? 制药 公司 研制 的 新 药 对 疾病 的 疗效 如 何 ? 这 些 都 是 研究 
者 感 兴趣 却 又 不 知道 答案 的 问题 。 为 了 回答 这 些 问题 ,我 们 需要 搜集 相关 的 数据 进行 
分 析 。 也 就 是 说 , 当 研 究 的 问题 明确 后 ,我 们 就 要 考虑 搜集 研究 所 需要 的 数据 。 本 项 目 
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主要 讨论 了 搜集 数据 的 方法 ,以 及 如 何 设计 调查 问卷 来 获取 数据 ,分 析 了 数据 采集 误差 
产生 的 原因 。 


[2. 1 数据 的 来 源 


数据 可 以 从 现 有 来 源 中 搜集 ,也 可 以 通过 调查 获得 。 
b 2.1.1 现 有 来 源 


在 一 般 情 况 下 ,公司 内 部 产生 的 数据 都 会 被 保存 ,如 商品 交易 数据 、 
财务 数据 客户 信息 .职工 薪酬 职员 年 龄 和 服务 年 限 、 缴 纳 保险 记录 等 。 
表 2-1 是 一 些 公司 内 部 记录 得 到 的 常用 数据 。 


表 2-1 公司 内 部 记录 的 可 用 数据 


数据 来 源 典型 的 可 用 数据 

雇员 记录 姓名 .性别 .年龄 .薪酬 .休假 天 数 .奖金 

生产 记录 部 件 及 编号 .生产 数量 ,直接 人 工 成 本 和 原材料 成 本 

存货 记录 产品 编号 ,存货 数量 ,存货 出 和 人 库 记录 周转 水 平 .存货 损耗 
销售 记录 产品 编号 、 销 售 数量 、 区 分 不 同类 型 客户 销售 记录 

信用 记录 违约 情况 记录 贷款 还 款 记录 应 收 账 款 余额 

客户 记录 客户 姓名 ,性 别 、 联 系 方式 、 家 庭 情况 .爱好 

设备 记录 设备 编号 .数量 .维修 记录 使 用 记录 完好 程度 


对 特定 研究 对 象 ,我 们 可 以 通过 查询 公司 内 部 记录 来 搜集 。 对 于 专业 研究 人 员 来 说 , 获 
取 数 据 的 一 种 方式 是 从 专门 搜集 和 保存 数据 的 机 构 那里 获取 ,这 种 来 自 外 部 的 数据 有 一 些 
可 以 免费 共享 ,如 国家 统计 局 和 一 些 公益 组 织 公布 的 一 些 数据 ,可 以 免费 获得 ,如 图 2-1 所 
示 ; 另 外 一 种 方式 是 通过 向 数据 提供 方 购买 获得 数据 的 使 用 权 , 如 彭 博 社 . 国 研 网 等 能 够 为 
客户 提供 大 量 的 商业 数据 信息 。 

数据 也 可 以 从 行业 协会 或 者 非 营利 机 构 中 获取 。 如 中 国 钢 铁 工 业 协 会 保存 的 钢铁 
企业 生产 情况 、 产 品 销售 信息 、 钢 铁 企 业 和 至 利 等 数据 ,相关 的 行业 和 专业 研究 人 员 会 对 
这 些 数 据 感 兴趣 ;中 国旅 游 协 会 保存 了 各 地 与 旅游 相关 的 信息 ,如 游客 数量 、 旅 游 消 费 
等 ;一 些 金融 机 构 也 提供 一 些 金融 信息 ,使 用 大 多 数 来 自 这 些 类 型 的 数据 需要 支付 一 定 
的 费用 。 

互联 网 的 迅速 发 展 ,已 经 成 为 数据 搜集 和 获取 的 一 个 重要 来 源 。 几 乎 所 有 公司 的 一 般 
信息 ,如 公司 经 营 状 况 、 雇 员 人 数 、 产 品 、 产 量 、 价 格 、 销 售 情况 等 都 可 以 通过 其 公司 网 站 来 进 
行 查询 ;另外 ,大 多 数 公司 也 通过 互联 网 获取 有 用 的 市 场 信 息 和 数据 ,可 以 通过 上 网 查询 每 
只 股票 的 价格 .交易 信息 、 股 东 资 料 等 ;也 可 以 通过 网 站 来 查询 某 一 餐馆 菜谱 的 报价 和 提供 
的 打折 信息 ,或 者 是 某 一 商业 机 构 正 在 进行 的 促销 活动 等 各 种 信息 。 
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图 2-1 国家 统计 局 数据 查询 主页 


政府 机 构 也 是 现 有 数据 获取 的 另 一 个 重要 渠道 。 例 如 和 人 力 资源 与 社会 保障 部 保存 了 大 
量 的 有 关 就 业 ,薪酬 劳动力 规模 人力 资 源 分 布 等 数据 。 表 2-2 是 列 示 了 部 分 政府 机 构 提 
供 的 一 些 数据 。 这 类 数据 也 是 政府 搜集 ,整理 后 向 社会 公布 的 数据 。 


表 2-2 政府 机 构 公 布 的 可 用 数据 


政府 机 构 可 用 数据 示例 
国家 统计 局 人 口 普 查 数据 经济 普 查 数据 .工业 普查 数据 .各 类 经 济 指数 
ee 公路 水运、 铁 路、 民航 等 多 种 交通 方式 的 运输 量 、 运 输 工具 ,运程 、 相 关 经 济 统 
交通 运输 部 

计数 据 

民政 部 社会 服务 统计 数据 婚姻 登记 信息 
中 国人 民 银 行 货币 供应 、 信 用 记录 汇率 、 利 率 数据 
人 力 资 源 与 社会 保障 部 | 各 类 人 力 资源 数量 统计 、 就 业 率 、 工 资 水 平 . 失 业 保 障 信息 


2.1.2 统计 调查 


有 时 ,一 些 专 题 性 质 的 统计 数据 并 不 能 从 已 有 来 源 中 获得 ,这 种 情况 下 ,常常 需要 用 统 
计 调 查 的 方式 来 获取 。 
主要 的 调查 方式 有 以 下 5 种 : 


E 普查 


普查 是 为 了 某 种 特定 的 目的 而 专门 组 织 的 一 次 性 的 全 面 调查 。 它 是 统计 调查 的 组 织 形 
式 之 一 。 对 统计 总 体 的 全 部 单位 进行 调查 以 搜集 统计 资料 的 工作 。 普 查 资料 常 被 用 来 说 明 
现象 在 一 定时 点 上 的 全 面 情况 。 如 人 口 普 查 就 是 对 全 国人 口 一 一 进行 调查 登记 ,规定 某 个 
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特定 时 点 作为 全 国 统一 的 统计 时 点 ,以 反映 有 关 人 口 的 自然 和 社会 的 各 类 特征 。 

我 国 普查 实行 规范 化 和 制度 化 ,每 人 逢 末尾 数字 为 0 的 年 份 进行 人 口 普 查 ,末尾 数字 为 3 
的 年 份 进行 第 三 产业 普查 ,末尾 数字 是 5 的 年 份 进行 工业 普查 ,未 尾数 字 是 1 或 6 的 年 份 进 
行 统计 的 基本 单位 普查 。 


B 抽样 调查 


抽样 调查 是 指 从 研究 对 象 的 总 体 中 抽取 一 部 分 单位 作为 样本 进行 调查 , 据 此 推断 有 关 
总 体 的 数字 特征 。 是 统计 调查 中 最 常用 的 调查 方式 。 

抽样 调查 是 根据 部 分 实际 调查 结果 来 推断 总 体 标志 总 量 的 一 种 统计 调查 方法 ,属于 非 
全 面 调查 的 范畴 。 它 是 按照 科学 的 原理 和 计算 ,从 若干 单位 组 成 的 事物 总 体 中 ,抽取 部 分 样 
本 单位 来 进行 调查 观察 ,用 所 得 到 的 调查 标志 的 数据 以 代表 总 体 ,推断 总 体 。 

(1) 简单 随机 抽样 。 它 是 指 对 总 体 不 作 任何 处 理 ,不 进行 分 类 也 不 进行 排除 ,而 是 完全 
按 随机 的 原则 ,直接 从 总 体 中 抽取 样本 单位 加 以 观察 。 从 理论 上 说 ,是 最 符合 抽样 调查 的 随 
机 原则 ,是 抽样 调查 的 最 基本 形式 。 

(2) 分 层 抽 样 。 将 总 体 各 单位 按 主要 标志 加 以 分 层 , 而 后 在 各 层 中 按 随机 的 原则 抽取 
若干 样本 单位 ,由 各 层 的 样本 单位 组 成 一 个 样本 。 

(3) 等 距 抽样 。 将 总 体 全 部 单位 按 某 一 标志 排队 ,而 后 按 固定 的 顺序 和 相等 间隔 在 总 
体 中 抽取 若干 样本 单位 ,构成 一 个 容量 为 的 样本 。 

(4) 整 群 抽样 。 将 总 体 各 单位 划分 为 若干 群 , 然 后 以 群 为 单元 ,从 总 体 中 随机 抽取 一 部 
分 群 ,对 被 抽 中 的 群 内 所 有 单位 进行 全 面 调查 。 整 群 抽样 对 总 体 划 分 群 的 基本 要 求 是 不 重 
复 .无 遗漏 。 

(5) 多 阶段 抽样 。 当 总 体 很 大 时 ,可 把 抽样 过 程 分 成 几 个 过 渡 阶 段 ,到 最 后 才 具 体 抽 到 
样本 单位 。 


Is. 重点 调查 


重点 调查 是 在 调查 对 象 中 选择 一 部 分 重点 单位 进行 的 一 种 非 全 面 调查 。 这 些 重点 单位 
虽然 数目 不 多 ,但 它们 的 标志 总 量 在 总 体 总 量 中 却 占据 了 绝 大 部 分 。 因 此 , 当 调 查 的 任务 只 
要 求 掌握 事物 的 基本 状况 与 基本 的 发 展 趋势 ,而 不 要 求 掌握 全 面 的 准确 资料 ,而 且 在 总 体 中 
确实 存在 着 重点 单位 时 ,进行 重点 调查 是 比较 适宜 的 。 


Ẹ 典型 调查 


典型 调查 是 一 种 非 全 面 的 专门 调查 , 它 是 根据 调查 的 目的 与 要 求 ,在 对 被 调查 对 象 进行 
全 面 分 析 的 基础 上 ,有 意识 地 选择 若干 具有 典型 意义 的 或 有 代表 性 的 单位 进行 的 调查 。 其 
主要 作用 是 :补充 全 面 调查 的 不 足 ; 验 证 全 面 调查 数据 的 真实 性 。 

典型 调查 同 其 他 调查 方法 相 比 较 , 具 有 灵活 机 动 . 通 过 少数 典型 即 可 取得 深入 ,翔实 的 统 
计 资料 的 优点 。 但 是 ,这 种 调查 由 于 受 * 有 意识 地 选 出 若干 有 代表 性 ?的 限制 ,在 很 大 程度 上 受 
人 们 主观 认识 上 的 影响 ,因此 ,必须 同 其 他 调查 结合 起 来 使 用 ,才能 避免 出 现 主观 片面 性 。 
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Bs. 统计 报表 


统计 报表 是 按 统一 规定 的 表格 形式 、 统 一 的 报 送 程序 和 报表 时 间 , 自 下 而 上 提供 基础 统 
计 资 料 ,是 一 种 具有 法 律 性 质 的 报表 制度 。 

统计 报表 是 一 种 以 全 面 调查 为 主 的 调查 方式 , 它 是 由 政府 主管 部 门 根据 统计 法 规 , 以 统 
计 表 格 形式 和 行政 手段 自 上 而 下 布置 ,而 后 由 企 . 事 业 单位 自 下 而 上 层 层 汇 总 上 报 , 逐 级 提 
供 基 本 统计 数据 的 一 种 调查 方式 。 


2.1.3 实验 数据 


实验 数据 一 般 通 过 科学 实验 来 获得 。 在 一 项 实验 性 的 研究 中 ,首先 要 确定 感 兴趣 的 主 
要 变量 ,然后 控制 一 个 或 多 个 其 他 变量 ,以 便 获得 它们 如 何 影响 主要 变量 的 数据 。 例 如 ,一 
家 制药 公司 可 能 会 进行 一 项 实验 ,以 获得 一 种 新 药 如 何 影响 血压 的 情况 。 在 研究 中 ,血压 是 
感 兴趣 的 主要 变量 ,新 药 的 剂量 是 影响 血压 的 另 一 个 变量 ,实验 希望 能 找到 新 药剂 量 与 血压 
之 间 的 因果 关系 。 为 了 获得 有 关 新 药 疗效 的 数据 ,研究 人 员 选 择 了 一 些 个 体 组 成 样本 。 控 
制 新 药 的 剂量 ,对 不 同 的 个 体 组 给 予 不 同 的 剂量 水 平 , 然 后 搜集 每 组 服药 前 后 的 血压 数据 。 
实验 数据 的 统计 分 析 将 有 助 于 我 们 了 解 新 药 如 何 影 响 血 压 。 


2.2 ”统计 调查 方案 的 设计 


统计 调查 方案 是 统计 调查 前 所 制订 的 实施 计划 ,是 全 部 调查 过 程 的 指导 性 文件 ,是 调查 
工作 有 计划 .有 组 织 ` 有 系统 进行 的 保证 。 统 计 调查 方案 应 确定 的 内 容 有 调查 目的 与 任务 、 
调查 对 象 与 调查 单位 .调查 项 目 与 调查 表 、 调 查 时 间 和 调查 时 限 .调查 的 组 织 实施 计划 。 
统计 调查 方案 一 般 包 括 以 下 几 项 基本 内 容 。 


2.2.1 确定 调查 目的 


任何 一 项 调查 任务 都 应 该 明确 调查 目的 ,明确 统计 调查 需要 解决 什么 问题 ,了 解 哪些 情 
况 。 这 是 统计 调查 最 重要 的 问题 。 如 果 目 的 不 明确 ,就 无 法 确定 向 谁 调 查 、 调 查 什么 、 怎 样 
调查 ,其 结果 是 调查 来 的 资料 可 能 不 满足 需要 ,造成 人 力 物力 的 浪费 和 时 间 的 延误 。 调 查 目 
的 和 整个 统计 研究 工作 目的 是 一 致 的 。 


2.2.2 确定 调查 对 象 和 调查 单位 


调查 对 象 是 所 要 调查 的 许多 单位 组 成 的 总 体 。 统 计 总 体 在 统计 调查 阶段 就 表现 为 调查 
对 象 , 它 的 范围 由 调查 目的 所 决定 。 调 查 单位 是 构成 调查 对 象 的 每 一 个 单位 , 即 总 体 单位 ， 
也 就 是 在 调查 中 应 该 登记 其 标志 项 目的 那些 具体 单位 。 

例如 ,如 果 调 查 目的 是 要 了 解 某 市 企业 的 生产 经 营 状况 , 则 调查 对 象 是 该 市 所 有 企业 ， 
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调查 单位 是 该 市 每 个 企业 。 

在 确定 调查 单位 时 ,还 要 确定 填报 单位 (又 称 报告 单位 )。 填 报 单位 就 是 提交 调查 资料 
的 单位 。 调 查 单位 和 填报 单位 有 时 一 致 ,有 时 不 一 致 。 

例如 当 统 计 调 查 搜集 企业 生产 经 营 活动 资料 时 ,每 一 个 企业 既是 调查 单位 又 是 填报 单 
位 ;又 如 当 统 计 调 查 是 了 解 企业 生产 设备 状况 时 ,调查 单位 是 企业 每 一 台 生 产 设备 ,填报 单 


位 是 每 一 个 企业 。 
> 2.2.3 确定 调查 项 目 设 计 调查 问卷 


调查 项 目 是 指向 调查 单位 所 调查 的 具体 内 容 , 即 向 调查 单位 所 调查 登记 的 标志 。 确 定 
调查 项 目 ,也 就 明确 了 应 向 调查 单位 调查 什么 ,搜集 哪些 资料 的 问题 。 

确定 调查 项 目 时 要 注意 三 个 问题 :一 是 所 选择 的 项 目 是 调查 任务 所 需要 并 且 确 实 能 够 
取得 资料 的 ,不 必要 或 者 虽然 需要 但 没有 可 能 取得 资料 的 项 目 不 应 列 入 ;二 是 每 个 调查 项 目 
应 该 有 确切 的 含义 和 统一 的 解释 ,以 免 调查 人 员 或 被 调查 者 按照 各 自 不 同 的 理解 进行 回答 ， 
使 得 调查 结果 无 法 汇总 ;三 是 调查 项 目 之 间 尽 可 能 相互 联系 ,以 便 相 互 印 证 。 还 要 注意 现行 
的 调查 项 目 与 过 去 同类 调查 项 目 之 间 的 衔接 .便于 动态 对 比 。 

调查 项 目 确定 以 后 ,需要 将 其 用 一 定 的 表格 形式 表现 出 来 。 调 查 表 就 是 将 调查 项 目 按 
一 定 顺序 排列 所 形成 的 表格 。 调 查 表 有 单一 表 和 一 览 表 两 种 形式 。 单 一 表 是 在 一 份 调查 表 
中 只 登记 一 个 调查 单位 ,一览表 是 在 一 份 调查 表 中 登记 若干 个 调查 单位 。 在 调查 项 目 不 多 
时 ,一览表 只 需 对 每 个 调查 单位 的 共同 事项 登记 一 次 , 它 比 单一 表 节 省 人 力 和 时 间 。 


2.2.4 选择 调查 方法 


E 访问 调查 


访问 调查 又 称 派 员 调查 , 它 是 调查 者 与 被 调查 者 通过 面对面 的 交谈 而 得 到 所 需 资 料 的 调 
查 方法 。 访 问 调查 的 方式 有 标准 式 访 问 和 非 标准 式 访问 两 种 。 标 准 式 访 问 又 称 结构 式 访问 ， 
它 是 按照 调查 人 员 事 先 设计 好 的 .有 固定 格式 的 标准 化 问卷 .有 顺序 地 依次 提问 ,并 由 受 访 者 
做 出 回答 ; 非 标 准 式 访问 又 称 非 结构 式 访问 , 它 事先 不 制作 统一 的 问卷 或 表格 ,没有 统一 的 提 
问 顺序 ,调查 人 员 只 是 给 一 个 题目 或 提纲 ,由 调查 人 员 和 受 访 者 自由 交谈 ,以 获得 所 需 的 资料 。 


B 邮寄 调查 


邮寄 调查 是 通过 邮寄 或 其 他 方式 将 调查 问卷 送 至 被 调查 者 ,由 被 调查 者 填写 ,然后 将 问 
卷 寄 回 或 投放 到 指定 收集 点 的 一 种 调查 方法 。 邮 和 寄 调 查 是 一 种 标准 化 调查 ,其 特点 是 调查 
人 员 和 被 调查 者 没有 直接 的 语言 交流 ,信息 的 传递 完全 依赖 于 问卷 。 邮 寄 调 查 的 问卷 发 放 
方式 有 邮寄 ,宣传 媒介 传送 ,专门 场所 分 发 三 种 。 

邮寄 调查 的 基本 程序 是 :在 设计 好 问卷 的 基础 上 , 先 在 小 范围 内 进行 预 调查 ,以 检查 问 
卷 设计 中 是 否 存 在 问题 ,以 便 纠正 ,然后 选择 一 定 的 方式 将 问卷 发 放下 去 ,进行 正式 的 调查 ， 
再 将 问卷 按 预定 的 方式 收回 ,并 对 问卷 进行 处 理 和 分 析 。 
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É 电话 调查 


电话 调查 是 调查 人 员 利 用 电话 同 受 访 者 进行 语言 交流 ,从 而 获得 信息 的 一 种 调查 方式 。 
电话 调查 具有 时 效 快 、 费 用 低 等 特点 。 随 着 电话 的 普及 ,电话 调查 的 应 用 也 越 来 越 广泛 。 电 
话 调查 可 以 按照 事先 设计 好 的 问卷 进行 ,也 可 以 针对 某 一 专门 问题 进行 电话 采访 。 用 于 电 
话 调查 的 问题 要 明确 ,问题 数量 不 宜 过 多 。 


Ẹ 座谈 会 


座谈 会 也 称 为 集体 访谈 法 , 它 是 将 一 组 受 访 者 集中 在 调查 现场 ,让 他 们 对 调查 的 主题 
(如 一 种 产品 ,一 项 服务 或 其 他 话题 等 ) 发 表意 见 , 从 而 获取 调查 资料 的 一 种 方法 。 通 过 座谈 
会 ,研究 人 员 可 以 从 一 组 受 访 者 那里 获得 所 需 的 定性 资料 ,这 些 受 访 者 与 研究 主题 有 某 种 程 
度 上 的 关系 。 为 获得 此 类 资料 ,研究 人 员 通 过 严格 的 甄别 程序 选取 少数 受 访 者 ,围绕 研究 主 
题 以 一 种 非 正式 的 .比较 自由 的 方式 进行 讨论 。 这 种 方法 适用 于 搜集 与 研究 课题 有 密切 关 
系 的 少数 人 员 的 倾向 和 意见 。 

参加 座谈 会 的 人 数 不 宜 太 多 ,通常 有 6 一 10 人 ,并 且 是 有 关 调 查 问题 的 专家 或 有 经 验 的 
人 。 讨 论 方式 主要 取决 于 主持 人 的 习惯 和 爱好 。 通 过 小 组 讨论 ,能 获取 访问 调查 无 法 取得 
的 资料 。 而 且 ,在 彼此 间 交 流 的 环境 里 ,各 个 受 访 者 之 间 相 互 影响 、 相 互 启发 .相互 补充 ,并 
在 座谈 过 程 中 不 断 修正 自己 的 观点 ,从 而 有 利于 取得 较为 广泛 、 深 入 的 想法 和 意见 。 座 谈 会 
的 另 一 个 优点 是 不 会 因为 问卷 过 长 遭 到 拒 访 。 当 然 , 这 要 求 主 持 人 一 般 要 受过 心理 学 或 行 
为 科学 方面 的 训练 ,具有 很 强 的 组 织 能 力 , 足 以 控制 一 群 不 同 背景 的 陌生 人 ,并 尽 可 能 多 地 
引导 受 访 者 说 出 他 们 的 真实 意见 或 想法 。 


| 5. 个 别 深度 访问 


深度 访问 是 一 次 只 有 一 名 受 访 者 参加 的 特殊 的 定性 研究 。“ 深 访 ” 这 一 术语 也 上 暗示 着 
要 不 断 深入 受 访 者 的 思想 当中 ,努力 发 据 他 行为 的 真实 动机 的 意思 。 深 访 是 一 种 无 结构 
的 个 人 访问 ,调查 人 员 运用 大 量 的 追问 技巧 , 尽 可 能 让 受 访 者 自由 发 挥 ,表达 他 的 想法 和 
感受 。 

深度 访问 常用 于 动机 研究 ,如 消费 者 购买 某 种 产品 的 动机 等 ,以 发 握 受 访 者 非 表 面 化 的 
深层 意见 。 这 一 方法 最 宜 于 研究 较 隐秘 的 问题 ,如 个 人 隐私 问题 ,或 较 敏 感 的 问题 ,如 政治 
性 的 问题 。 对 于 一 些 不 同人 之 间 观 点 差异 极 大 的 问题 ,采用 深度 访问 法 比较 合适 。 

座谈 会 和 个 别 深 访 属于 定性 方法 , 它 通常 围绕 一 个 特定 的 主题 取得 有 关 定 性 资料 。 在 
此 类 研究 中 ,从 挑选 的 少数 受 访 者 中 取得 有 关 意 见 。 这 种 方法 和 定量 方法 是 有 区 别 的 ,定量 
方法 是 从 总 体 中 按 随 机 方式 抽取 样本 取得 资料 ,其 研究 结果 或 结论 可 以 进行 推论 。 而 定性 
研究 着 重 于 问题 的 性 质 和 未 来 趋势 的 把 握 ,不 是 对 研究 总 体 数 量 特征 的 推断 。 


Jc. 网 上 调查 


毫 无 疑问 ,互联 网 已 经 成 为 人 们 相互 交流 沟通 、 参 与 互动 的 重要 渠道 。 通 过 网 络 搜集 数 
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mem 


SSE) ASRS + ADAR > PERS 


PAIS 


ASER: 6 个 站 是 1 页 已 被 引用 0 次 


5: Ie: 


QL: EDERE: 
Q: SIRS: 

Q: 2 和 和 在 : 

Q4 : ETENDE) : 

05 ; 对 于 和 的] 发 放 , 您 单位 前 用 用 什么 性 质 的 方式 进行 ? 
QG : SANS ENTRAR RESET AF AER ? 


RRS 


图 2-2 一 个 在 线 调查 网 站 的 示例 


b 2.2.6 制订 调查 的 组 织 和 实施 计划 
严密 细致 的 组 织 工作 ,是 统计 调查 成 功 实施 的 保证 。 调 查 的 组 织 计划 主要 包括 以 下 内 


容 : 调 查 工作 的 组 织 机 构 、 人 员 配 备 与 分 工 ; 调 查 前 的 准备 工作 如 人 员 培 训 、 资 料 的 印发 . 方 
案 的 布置 .经费 的 筹措 等 ;调查 工作 的 检查 、 监 督 和 进度 安排 ;提供 或 公布 调查 成 果 的 时 间 。 


2.3 统计 调查 问卷 的 设计 


问卷 又 称 调查 表 或 询问 表 , 是 以 问题 的 形式 系统 地 记载 调查 内 容 的 一 种 印 件 。 问 卷 可 
以 是 表格 式 .卡片 式 或 短 记 式 。 设 计 问卷 ,是 询问 调查 的 关键 。 完 美的 问卷 必须 具备 两 个 功 
能 , 即 能 将 问题 传达 给 被 问 的 人 和 使 被 问 者 乐于 回答 。 要 完成 这 两 个 功能 ,问卷 设计 时 应 当 
遵循 一 定 的 原则 和 程序 ,运用 一 定 的 技巧 。 


> 2.3. 1 问卷 设计 的 原则 


(1) 有 明确 的 主题 。 根 据 调查 主题 ,从 实际 出 发 拟 题 ,题目 的 明确 ,重点 突出 ,没有 可 有 
可 无 的 问题 。 

(2) 结构 合理 .多 辑 性 强 。 问 题 的 排列 应 有 一 定 的 逻辑 顺序 ,符合 应 答 者 的 思维 程序 。 
一 般 是 先 易 后 难 、 先 简 后 繁 、 先 具体 后 抽象 。 

G) 通俗 易 懂 。 问 卷 应 使 应 答 者 一 目 了 然 ,并 愿意 如 实 回答 。 问 卷 中 语气 要 亲切 ,符合 
应 答 者 的 理解 能 力 和 认识 能 力 ,避免 使 用 专业 术语 。 对 敏感 性 问题 采取 一 定 的 技巧 调查 ,使 
问卷 具有 合理 性 和 可 答 性 ,避免 主观 性 和 暗示 性 ,以 免 答案 失真 。 

(4) 控制 问卷 的 长 度 。 回 答 问 卷 的 时 间 控 制 在 20 分 钟 左右 ,问卷 中 既 不 浪费 一 个 问 
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句 , 也 不 遗漏 一 个 问 句 。 
(5) 便于 资料 的 校 验 、 整 理 和 统计 。 


b 2.3.2 问卷 设计 的 程序 


(1) 确定 主题 和 资料 范围 。 根 据 调查 目的 的 要 求 ,研究 调查 内 容 . 所 需 收 集 的 资料 及 资 
料 来 源 、 调 查 范 围 等 ,酝酿 问卷 的 整体 构思 ,将 所 需要 的 资料 一 一 列 出 ,分 析 哪 些 是 主要 资 
料 ,哪些 是 次 要 资料 ,哪些 是 可 要 可 不 要 的 资料 ,淘汰 那些 不 需要 的 资料 ,再 分 析 哪 些 资料 需 
要 通过 问卷 取得 、 需 要 向 谁 调查 等 ,并 确定 调查 地 点 、 时 间 及 对 象 。 

(2) 分 析 样 本 特征 。 分 析 了 解 各 类 调查 对 象 的 社会 阶层 、 社 会 环境 行为 规范 、 观 念 习 
俗 等 社会 特征 ;需求 动机 、 潜 在 欲望 等 心理 特征 ;理解 能 力 、 文 化 程度 、 知 识 水 平等 学 识 特征 ， 
以 便 针 对 其 特征 来 拟 题 。 

(3) 拟定 并 编排 问题 。 首 先 构想 每 项 资料 需要 用 什么 样 的 句 型 来 提问 ,尽量 详尽 地 列 
出 问题 ,然后 对 问题 进行 检查 .筛选 , 看 它 有 无 多 余 的 问题 ,有 无 遗漏 的 问题 ,有 无 不 适当 的 
问 句 ,以 便 进 行 删 . 补 、 换 。 

(4) 进行 试问 试 答 。 站 在 调查 者 的 立场 上 试行 提问 ,看 看 问题 是 否 清楚 明白 ,是 否 便于 
资料 的 记录 ,整理 ;站 在 应 答 者 的 立场 上 试行 回答 ,看 看 是 否 能 答 和 愿 答 所 有 的 问题 ,问题 的 
顺序 是 否 符合 思维 逻辑 。 估 计 回 答 时 间 是 否 合乎 要 求 。 有 必要 在 小 范围 进行 实地 试 答 ,以 
检查 问卷 的 质量 。 

(5) 修改 、 付 印 。 根 据 试 答 情 况 ,进行 修改 ,再 试 答 , 再 修改 ,直到 完全 合格 以 后 才 定稿 
付 印 , 制 成 正式 问卷 。 


> 2.3.3 问题 的 形式 


E 开放 式 问题 


又 称 无 结构 的 问答 题 。 在 采用 开放 式 问 题 时 ,应 答 者 可 以 用 自己 的 语言 自由 地 发 表意 
见 ,在 问卷 上 没有 已 拟定 的 答案 。 

例如 :您 抽 香 烟 多 久 了 ? 您 喜欢 看 哪 一 类 的 电视 节目 ? 

显然 ,应 答 者 可 以 自由 回答 以 上 的 问题 ,并 不 需要 按照 问卷 上 已 拟定 的 答案 加 以 选择 ， 
因此 应 答 者 可 以 充分 地 表达 自己 的 看 法 和 理由 ,并 且 比 较 深 入 ,有 时 还 可 获得 研究 者 始 料 未 
及 的 答案 。 通 常 而 言 ,问卷 上 的 第 一 个 问题 采用 自由 式 问题 ,让 应 答 者 有 机 会 尽量 发 表意 
见 , 这 样 可 制造 有 利 的 调查 气氛 ,缩短 调查 者 与 应 答 者 之 间 的 距离 。 

然而 ,开放 式 问 题 亦 有 其 缺点 。 例 如 调查 者 的 偏见 , 因 记录 应 答 者 答案 是 由 调查 者 执 
笔 , 极 可 能 失真 ,或 并 非 应 答 者 原来 的 意思 。 如 果 调 查 者 按照 他 自己 的 理解 来 记录 ,就 有 出 
现 偏见 的 可 能 。 但 这 些 不 足 可 运用 录音 机 来 弥补 。 开 放 式 问题 的 第 二 个 主要 缺点 是 资料 整 
理 与 分 析 的 困难 。 由 于 各 种 应 答 者 的 答案 可 能 不 同 , 所 用 字眼 各 异 , 因 此 在 答案 分 类 时 难免 
出 现 困难 ,整个 过 程 相当 耗费 时 间 ,而 且 免 不 了 夹杂 整理 者 个 人 的 偏见 。 因 此 ,开放 性 问题 
在 探索 性 调研 中 是 很 有 帮助 的 ,但 在 大 规模 的 抽样 调查 中 EEK AT. 
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B 封闭 式 问题 


又 称 有 结构 的 问答 题 。 封 闭 式 问题 与 开放 式 问题 相反 , 它 规定 了 一 组 可 供 选择 的 答案 
和 固定 的 回答 格式 。 

例如 :你 购买 洗衣 液 的 主要 原因 是 (选择 最 主要 两 种 ): 

今 洗衣 较 洁白 

<> FE BP BEE 

今 任何 商店 都 有 出 售 

今 不 伤 手 

今 价格 与 已 有 的 牌子 相同 ,但 分 量 较 多 

今 朋 友 介 绍 

封闭 式 问题 的 优点 包括 以 下 几 个 方面 : 

CL) 答案 是 标准 化 的 ,对 答案 进行 编码 和 分 析 都 比较 容易 ; 

D 回答 者 易于 作答 ,有 利于 提高 问卷 的 回收 率 ; 

(3) 问题 的 含义 比较 清楚 。 因 为 所 提供 的 答案 有 助 于 理解 题 意 ,这 样 就 可 以 避免 回答 
者 由 于 不 理解 题 意 而 拒绝 回答 。 

封闭 式 问 题 也 存在 一 些 缺点 : 

(1) 难以 觉察 出 未 正确 理解 题目 的 回答 ; 

(2) 可 能 产生 “顺序 偏差 ?或 “位 置 偏差 ”, 即 被 调查 者 选择 答案 可 能 与 该 答案 的 排列 位 
置 有 关 。 研 究 表明 ,对 陈述 性 答案 被 调查 者 趋向 于 选 第 一 个 或 最 后 一 个 答案 ,特别 是 第 一 个 
答案 。 而 对 一 组 数字 (数量 或 价格 ) 则 趋向 于 取 中 间 位 置 的。 为 了 减少 顺序 偏差 ,可 以 准备 
几 种 形式 的 问卷 ,每 种 形式 的 问卷 答案 排列 的 顺序 都 不 同 。 


2.3.4 问卷 调查 设计 技巧 


E 事实 性 问题 


事实 性 问题 主要 是 要 求 应 答 者 回答 一 些 有 关 事实 的 问题 。 例 如 :你 通常 什么 时 候 看 电视 ? 

事实 性 问题 的 主要 目的 在 于 求 取 事实 资料 ,因此 问题 中 的 字眼 定义 必须 清楚 ,让 应 答 者 
了 解 后 能 正确 回答 。 

市 场 调 查 中 ,许多 问题 均 属 “ 事 实 性 问题 ”, 例 如 应 答 者 个 人 的 资料 :职业 、 收 入 、 家 庭 状 
况 、 居 住 环境 教育 程度 等 。 这 些 问题 又 称 为 “分 类 性 问题 ”, 因 为 可 根据 所 获得 的 资料 而 将 
应 答 者 分 类 。 在 问卷 之 中 ,通常 将 事实 性 问题 放 在 后 边 , 以 免 应 答 者 在 回答 有 关 个 人 的 问题 
时 有 所 顾忌 ,因而 影响 以 后 的 答案 。 如 果 抽 样 方法 是 采用 配额 抽样 , 则 分 类 性 问题 应 置 于 问 
MELT ,否则 不 知道 应 答 者 是 否 符合 样本 所 规定 的 条 件 。 


B 意见 性 问题 


在 问卷 中 ,往往 会 询问 应 答 者 一 些 有 关 意 见 或 态度 的 问题 。 例 如 ,你 是 否 喜 欢 X XX 电视 节目 ? 
意见 性 问题 事实 上 即 态度 调查 问题 。 应 答 者 是 否 愿意 表达 他 真正 的 态度 ,固然 要 考虑 ， 


Q 


q 
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而 态度 强度 亦 有 不 同 , 如 何 从 答案 中 衡量 其 强 弱 , 显 然 也 是 一 个 需要 克服 的 问题 。 通 常 而 
言 , 应 答 者 会 受到 问题 所 用 字眼 和 问题 次 序 的 影响 , 即 反应 不 同 ,因而 答案 也 有 所 不 同 。 对 
事实 性 问题 ,可 将 答案 与 已 知 资料 加 以 比较 。 但 在 意见 性 问题 方面 则 较 难 作 比较 工作 , 因 
应 答 者 对 同样 问题 所 作 的 反应 各 不 相同 。 因 此 意见 性 问题 的 设计 远 较 事实 性 问题 困难 。 这 
种 问题 通常 有 两 种 处 理 方法 :其 一 是 对 意见 性 问题 的 答案 只 用 百分比 表示 ,例如 有 的 应 答 者 
同意 某 一 看 法 等 ; 另 一 方法 则 旨 在 衡量 应 答 者 的 态度 , 故 可 将 答案 化 成 分 数 。 


>. 困窘 性 问题 


困 窗 性 问题 是 指 应答 者 不 愿 在 调查 员 面前 作答 的 某 些 问题 ,比如 关于 私人 的 问题 ,或 不 
为 一 般 社会 道德 所 接纳 的 行为 态度 ,或 属 有 碍 声誉 的 问题 。 例 如 :平均 说 来 ,每 个 月 你 打 几 
次 麻将 ?如 果 你 的 汽车 是 分 期 购买 的 ,一 共 分 多 少 期 ? 你 是 否 向 银行 抵押 借款 购 股票 ? 除 
了 你 工作 收入 外 , 尚 有 其 他 收入 吗 ? 

如 果 一 定 要 想 获 得 困 容 性 问题 的 答案 ,又 避免 应 答 作 不 真实 回答 ,可 采用 以 下 方法 : 

(1) 间接 问题 法 。 不 直接 询问 应 答 者 对 某 事项 的 观点 ,而 改 问 他 对 该 事项 的 看 法 如 何 。 

(2) 卡片 整理 法 。 将 困窘 性 问题 的 答案 分 为 "是 与“ 否 "两 类 ,调查 员 可 暂时 走 开 ,让 应 
答 者 自己 取 卡 片 投 入 箱 中 ,以 减低 困 窄 气氛。 应答 者 在 无 调查 员 看 见 的 情况 下 ,选取 正确 答 
案 的 可 能 性 会 提高 不 少 。 

(3) 随机 反应 法 。 根 据 随 机 反应 法 ,可 估计 出 回答 困 窒 问题 的 人 数 。 

(4) 断定 性 问题 。 有 些 问 题 是 先 假定 应 答 者 已 有 该 种 态度 或 行为 。 

例如 ;你 每 天 抽 多 少 支 香烟 ? 事实 上 该 应 答 者 极 可 能 根本 不 抽烟 ,这 种 问题 则 为 断定 性 
问题 。 正 确 处 理 这 种 问题 的 方法 是 在 断定 性 问题 之 前 加 一 条 “过 滤 ” 问 题 。 

例如 :你 抽烟 吗 ? 如 果 应 答 者 回答 “是 ”, 用 断定 问题 继续 问 下 去 才 有 意义 ,否则 在 过 滤 
问题 后 就 应 停止 。 


fe. 假设 性 问题 


有 许多 问题 是 先 假定 一 种 情况 ,然后 询问 应 答 者 在 该 种 情况 下 ,他 会 采取 什么 行动 。 

例如 :如 果 X XX 晚报 涨 价 至 2 元 ,你 是 否 将 改 看 男 一 种 未 涨 价 的 晚报 ? 

如 果 XX 牌 洗衣 粉 跌价 1 元 ,你 是 否 愿意 用 它 ? 

你 是 否 愿意 加 薪 ? 

你 是 否 赞成 公共 汽车 公司 改善 服务 ? 

以 上 皆 属 假设 性 问题 .应答 者 对 这 种 问题 多 数 会 答 “ 是 ”。 这 种 探测 应 答 者 未 来 行为 的 问题 ， 
应 答 者 的 答案 事实 上 没有 多 大 意义 ,因为 多 数 人 都 愿意 尝试 一 种 新 东西 ,或 获得 一 些 新 经 验 。 


> 2.3.5 问卷 的 结构 
调查 问卷 一 般 可 以 看 成 是 由 三 大 部 分 组 成 :卷首 语 (开场 白 ) .正文 和 结尾 。 


E 卷首 语 


问卷 的 卷首 语 或 开场 白 是 致 被 调查 者 的 信 或 问候 语 。 其 内 容 一 般 包 括 下 列 几 个 方面 : 


一 一 名 
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(1) 称呼 .问候 。 如 *X 义 先生、 女士 :您 好 ”。 

(2) 调查 人 员 自 我 说 明 调查 的 主办 单位 和 个 人 的 身份 。 

G) 简要 地 说 明 调 查 的 内 容 、 目 的 、 填 写 方法 。 

(4) 说 明 作答 的 意义 或 重要 性 。 

(5) 说 明 所 需 时 间 。 

(6) 保证 作答 对 被 调查 者 无 负面 作用 ,并 替 他 保守 秘密 。 

(7) 表示 真诚 的 感谢 ,或 说 明 将 赠送 小 礼品 。 

信 的 语气 应 该 是 亲切 \ 诚 屋 而 礼貌 的 ,简明 扼要 ,切忌 喝 唆 。 问 卷 的 开头 是 十 分 重要 的 。 
大 量 的 实践 表明 ,几乎 所 有 拒绝 合作 的 人 都 是 在 开始 接触 的 前 几 秒 钟 内 就 表示 不 愿 参与 的 。 
如 果 潜 在 的 调查 对 象 在 听取 介绍 调查 来 意 的 一 开始 就 愿意 参与 的 话 , 那 么 绝 大 部 分 都 会 合 
作 ,而 且 一 旦 开始 回答 ,就 几乎 都 会 继续 并 完成 ,除非 在 非常 特殊 的 情况 下 才 会 中 止 。 


B 正文 


问卷 的 正文 实际 上 也 包含 了 三 大 部 分 。 

第 一 部 分 是 向 被 调查 者 了 解 最 一 般 的 问题 。 这 些 问 题 应 该 是 适用 于 所 有 的 被 调查 者 ， 
并 能 很 容易 回答 的 问题 。 在 这 一 部 分 不 应 有 任何 难 答 的 或 敏感 的 问题 ,以 免 吓 坏 被 调查 者 。 

第 二 部 分 是 主要 的 内 容 , 包 括 涉及 调查 主题 的 实质 和 细节 的 大 量 题目 。 这 一 部 分 的 结 
构 组 织 安排 要 有 好 辑 性 ,并 对 被 调查 者 来 说 应 是 有 意义 的 。 

第 三 部 分 一 般 包括 两 部 分 的 内 容 ,一 是 敏感 性 或 复杂 的 问题 ,以 及 测量 被 调查 者 的 态度 
或 特性 的 问题 ;二 是 人 口 基 本 状况 、 经 济 状况 等 。 


fs. 结尾 


问卷 的 结尾 一 般 可 以 加 上 1 一 2 道 开放 式 题目 .给 被 调查 者 一 个 自由 发 表意 见 的 机 会 。 
然后 ,对 被 调查 者 的 合作 表示 感谢 。 在 问卷 最 后 ,一般 应 附 上 一 个 “调查 情况 记录 ”。 这 个 记 
录 一 般 包括 : 

(1) 调查 人 员 ( 访 问 员 ) 姓 名 ,编号 ; 

(2) 受 访 者 的 姓名 、 地 址 .电话 号 码 等 ; 

(3) 问卷 编号 ; 

(4) 访问 时 间 ; 

(5) 其 他 ,如 设计 分 组 等 。 


b 2.3.6 问卷 设计 应 注意 的 问题 


E 问卷 的 开场 白 


问卷 的 开场 白 , 必 须 慎 重 对 待 ,要 以 亲切 的 口吻 询问 ,措辞 应 精心 切磋 ,做 到 言 简 意 明 ， 
亲切 诚 姑 ,使 被 调查 者 自愿 与 之 合作 ,认真 填 好 问卷 。 
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E 问题 的 语言 


由 于 不 同 的 字眼 会 对 被 调查 者 产生 不 同 的 影响 ,因此 往往 看 起 来 差不多 的 相同 的 问题 ， 
会 因 所 用 字眼 不 同 ,而 使 应 答 者 作出 不 同 的 反应 ,作出 不 同 的 回答 。 故 必须 注意 问题 所 用 的 
字眼 ,以 免 影 响 答案 的 准确 性 。 一 般 来 说 ,在 设计 问题 时 应 留意 以 下 几 个 原则 : 

(1) 避免 一 般 性 问题 。 如 果 问 题 的 本 来 目的 是 在 求 取 某 种 特定 资料 ,但 由 于 问题 过 于 
一 般 化 ,使 应 答 者 所 提供 的 答案 资料 无 多 大 意义 。 

例如 , 某 酒店 想 了 解 旅客 对 该 酒店 房租 与 服务 是 否 满意 ,因此 作 以 下 询问 : 

你 对 本 酒店 是 否 感 到 满意 ? 

这 样 的 问题 ,显然 有 欠 具 体 。 由 于 所 需 资 料 牵涉 到 房租 与 服务 两 个 问题 , 故 应 分 别 询 
问 , 以 免 混乱 ,如 : 

你 对 本 酒店 的 房租 是 否 满意 ? 

你 对 本 酒店 的 服务 是 否 满意 ? 

(2) 问卷 的 语言 要 口语 化 ,符合 人 们 交谈 的 习惯 ,避免 书面 化 和 文人 腔调 。 


Ẹ 问题 的 选择 及 顺序 


通常 问卷 的 头 几 个 问题 可 采用 开放 式 问 题 , 旨 在 使 应 答 者 多 多 讲话 ,多 发 表意 见 , 使 应 
答 者 感到 十 分 自在 ,不 受 拘束 ,能 充分 发 挥 自己 的 见解 。 当 应 答 者 话题 多 ,其 与 调查 者 之 间 
的 陌生 距离 自然 缩短 。 不 过 要 留意 ,最 初 安排 的 开放 式 问题 必须 较 易 回 答 , 不 可 具有 高 敏感 
性 问题 ,如 困 容 性 问题 。 否 则 一 开始 就 被 拒绝 回答 的 话 ,之 后 的 问题 就 难 继续 了 。 因 此 问题 
应 是 容易 回答 且 具 有 趣味 性 , 旨 在 提高 应 答 者 的 兴趣 。 核 心 问 题 往 往 置 于 问卷 中 间 部 分 ,分 
类 性 问题 如 收入 、 职 业 、 年 龄 通常 置 于 问卷 之 末 。 

问卷 中 问题 的 顺序 一 般 按 下 列 规 则 排列 : 

(1) 容易 回答 的 问题 放 前 面 , 较 难 回答 的 问题 放 稍 后 ,困窘 性 问题 放 后 面 ,个 人 资料 的 
事实 性 问题 放 卷 尾 。 

(2) 封闭 式 问题 放 前 面 , 自 由 式 问 题 放 后 面 。 由 于 自由 式 问题 往往 需要 时 间 来 考虑 答 
案 和 语言 的 组 织 , 放 在 前 面 会 引起 应 答 者 的 厌烦 情绪 。 

(3) 要 注意 问题 的 逻辑 顺序 ,按时 间 顺 序 、 类 别 顺序 等 合理 排列 。 
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统计 研究 人 员 必 须 意 识 到 ,不论 采用 什么 途径 或 哪 种 调查 方法 ,搜集 到 的 数据 总 会 由 于 
种 种 原因 而 存在 一 定 程度 的 误差 。 比 如 登记 过 程 的 重复 .遗漏 .记录 失误 等 原因 导致 的 误 
差 ,比如 ,在 登记 访问 对 象 的 年 龄 时 ,将 24 岁 写 为 42 岁 ,或 者 在 被 访 者 回答 问题 时 曲解 了 问 
题 而 给 出 了 不 正确 的 问答 。 

统计 数据 的 准确 性 是 数据 质量 的 核心 , 它 是 我 们 进行 研究 .分 析 和 决策 的 基础 ,而 数据 
的 准确 性 是 通过 误差 大 小 来 衡量 的 ,误差 越 小 越 好 。 同 时 ,由 于 被 测量 的 对 象 是 有 意识 的 行 
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为 ,采取 的 计量 手段 .计量 方法 受 各 种 条 件 的 约束 , 易 产 生 误差 。 

要 正确 地 看 待 、 利 用 统计 数据 ,一 方面 要 努力 降低 误差 精益求精; 另 一 方面 也 不 必 过 于 
苛刻 ,使 数据 可 用 信息 缺失 。 数 据 误差 产生 的 原因 很 多 ,对 于 主观 因素 的 误差 ,有 很 多 是 可 
以 通过 合理 的 调查 设计 和 科学 的 搜集 数据 的 方法 加 以 控制 ,如 增加 调查 的 样本 量 等 ,但 也 会 
受到 时 间 、 人 力 和 财力 等 条 件 的 限制 。 如 果 耗 费 30% 的 费用 只 能 降低 1%, 的 误差 ,而 这 样 的 
降低 又 并 非 必须 ,就 不 必 过 分 强调 误差 的 降低 。 在 实际 中 ,人 们 对 数据 的 准确 性 要 求 并 不 是 
绝对 的 ,而 是 相对 的 ,如 对 于 粮食 产量 的 测量 并 不 要 求 精确 到 克 , 因 此 ,按照 正确 的 步骤 搜集 
准确 的 数据 可 以 确保 决策 信息 的 可 靠 性 ,提高 数据 的 利用 价值 才 是 关键 。 


a» 


数据 可 以 从 现 有 来 源 中 搜集 ,或 通过 调查 来 获得 。 公 司 保存 的 数据 是 统计 研究 搜集 数 
据 最 直接 的 渠道 ;还 可 以 通过 统计 调查 机 构 、 政 府 机 构 \ 行 业 协会 和 数据 服务 提供 者 来 搜集 
到 统计 数据 。 

一 些 专题 性 质 的 统计 数据 并 不 能 从 已 有 来 源 中 获得 ,这 种 情况 下 ,常常 需要 统计 调查 的 
方式 来 获取 。 常 用 的 统计 调查 方式 有 普查 、 抽 样 调查 、 重 点 调查 、 典 型 调查 和 统计 报表 ,实验 
数据 通常 来 自 科 学 研究 。 

此 外 ,设计 统计 调查 问卷 ,也 是 获取 统计 数据 的 主要 手段 。 当 前 ,网 络 调 查 相 比 传统 的 
调查 方式 更 快捷 、 更 经 济 , 成 为 主要 的 统计 调查 方式 。 

数据 采集 误差 是 客观 存在 的 ,通过 科学 的 调查 设计 、 细 致 的 工作 步 又 ,确保 搜集 数据 的 
精确 性 。 


实 训 项 目 一 


网 络 是 信息 的 海洋 , 它 不 仅 为 我 们 创造 了 一 个 自我 表现 的 虚拟 空间 ,也 是 大 家 生活 、 学 
习 ,工作 交流 的 平台 。 对 于 大 学 生来 说 ,网 络 已 成 为 生活 的 一 部 分 ,那么 ,大 学 生活 中 对 网 络 
的 依赖 程度 到 底 有 多 大 ? 它 主要 的 用 途 是 怎样 的 ? 上 网 时 间 有 多 长 ? 上 网 的 开支 如 何 ? 带 
着 这 些 问题 ,请 你 组 织 一 个 团队 ,设计 一 份 调查 问卷 ,在 本 校 范围 内 开展 了 一 次 关于 大 学 生 
上 网 情况 的 调查 活动 ,并 撰写 调查 分 析 报 告 。 


实 训 项 目 二 


以 上 述 内 容 为 例 , 设 计 一 个 在 线 调 查 网 页 ,收集 网 络 调 查 数据 。 比 较 两 种 不 同调 查 方式 
获取 的 调查 数据 之 间 的 差异 。 


项 H 3 


”数据 的 整理 与 图 示 


项 目 3 ”数据 的 整理 与 图 示 


[==] 


>> > | 实践 中 的 统计 
奶粉 质量 管理 中 的 统计 


乳品 公司 在 生产 的 婴 幼 儿 配 方 奶粉 的 质量 保证 计划 中 使 用 了 统计 学 方法 。 其 中 一 个 关 
键 的 问题 是 顾客 对 盒 装 的 奶粉 数量 的 满意 度 。 相 同 尺 寸 的 盒 里 装 入 相同 重量 的 奶粉 ,但 是 
奶粉 的 体积 受到 奶 蛋白 密度 的 影响 。 例 如 , 奶 蛋白 的 密度 较 大 时 ,要 达到 所 规定 的 包装 重 
量 , 就 只 需要 较 小 体积 的 包装 数量 ,这 样 , 当 顾 客 打开 包装 盒 时 ,看 上 去 奶粉 没有 装 满 。 

为 了 控制 奶 蛋白 密度 过 大 的 问题 ,需要 对 奶 蛋白 密度 的 可 接受 范围 加 以 限制 。 定 期 地 
抽取 统计 样本 ,并 测量 每 一 个 奶 蛋白 样本 的 密度 。 然 后 将 汇总 的 数据 提供 给 生产 人 员 ,以便 
在 需要 将 奶 蛋白 密度 保持 在 规定 的 质量 标准 范围 内 时 ,生产 人 员 可 以 采取 正确 的 措施 。 

在 一 周 内 采集 了 150 个 奶 蛋 和 白 密度 的 样本 ,得 到 的 密度 频数 分 布 见 表 3-1, 直 方 图 如 
图 3-1 所 示 。 


表 3-1 密度 数据 的 频数 分 布 


密度 频数 
0. 29~0. 30 30 
0. 31~0. 32 75 
0. 33~0. 34 32 
0. 35~0. 36 9 
0. 37~0. 38 3 
0. 39~0. 40 1 
总 计 150 
75 上 
50} 
ES] 
R 
254 小 于 1% 的 样本 数据 接近 
不 可 接受 的 0.40 水 平 
0 
030 032 034 036 038 0.40 
密度 


3-1 密度 数据 的 直方 图 


密度 水 平 超过 0.4 是 可 以 接受 的 上 限 。 频 数 分 布 和 直方 图 表明 ,所 有 产品 的 密度 小 于 或 
等 于 0. 4, 生 产 符合 质量 标准 。 检 查 这 些 汇 总 结果 的 管理 人 员 对 奶粉 产品 的 质量 感到 满意 。 
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在 上 述 案 例 中 ,我 们 看 到 了 数据 常用 的 统计 表 和 统计 图 。 因 此 , 掌 
握 图 表 的 展示 方法 ,让 枯燥 的 数字 变 得 生动 起 来 ,也 是 我 们 要 学 习 的 重 
点 。 本 项 目 介 绍 常 用 于 汇总 数据 的 表格 和 图 形 , 包 括 频数 分 布 . 条 形 图 、 
直方 图 , 茎 叶 图 和 交叉 分 组 表 等 内 容 , 理 解 它们 是 如 何 表达 和 解释 数 
据 的 。 


3-1 分 类 型 数据 的 汇总 


> 3.1.1 


频数 与 频数 分 布 


频数 (frequency) 又 称 次 数 , 指 变量 值 中 代表 某 种 特征 的 数 (标志 值 ) 出 现 的 次 数 。 
频数 分 布 (frequency distribution) 是 一 种 数据 的 表格 汇总 ,表示 在 几 


个 互 不 重合 的 分 组 中 的 每 一 个 组 的 项 目 个 数 。 


我 们 用 下 面 的 例子 来 说 明 如 何 编制 和 解释 分 类 数据 的 频数 分 布 。 
可 口 可 乐 .健力宝 、 雪 奖 、 百 事 可 乐 、 芬 达 是 5 种 受 人 们 欢迎 的 饮料 。 假 
设 表 3-2 的 数据 是 在 只 选择 5 种 饮料 的 情况 下 ,50 次 购买 的 样本 数据 。 


表 3-2 50 次 购买 饮料 的 样本 


健力宝 可 口 可 乐 健力宝 芬 达 aa 
=e 健力宝 可 口 可 乐 ae 可 口 可 乐 
健力宝 可 口 可 乐 可 口 可 乐 百事 可 乐 健力宝 
可 口 可 乐 百事 可 乐 健力宝 可 口 可 乐 百事 可 乐 
百事 可 乐 ET =a 百事 可 乐 =e 
可 口 可 乐 健力宝 健力宝 芬 达 芬 达 
芬 达 健力宝 可 口 可 乐 可 口 可 乐 可 口 可 乐 
可 口 可 乐 百事 可 乐 Et} 芬 达 百事 可 乐 
Er 可 口 可 乐 百事 可 乐 可 口 可 乐 ee 
可 口 可 乐 健力宝 百事 可 乐 芬 达 健力宝 


销售 人 员 感 兴趣 的 是 市 场 上 哪 种 饮料 更 受 欢 迎 ? 我 们 通过 计算 表 3-2 中 每 种 饮料 
出 现 的 次 数 就 可 以 回答 这 个 问题 。 具 体 来 说 ,就 是 要 编制 这 些 数据 的 频数 分 布 表 , 见 


K 3-3, 
表 3-3 样本 数据 的 频数 分 布 
饮料 频数 饮料 频数 
可 口 可 乐 15 芬 达 6 
健力宝 11 aS 9 
百事 可 乐 9 总 计 50 
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这 个 频数 汇总 说 明了 50 次 购买 饮料 的 样本 中 ,5 种 饮料 是 如 何 分 配 的 。 它 提供 了 比 表 
3-2 更 多 的 信息 和 内 容 。 观 察 这 个 频数 分 布 表 ,可 以 看 到 可 口 可 乐 排 在 首位 ,揭示 了 这 种 牌 
子 的 饮料 在 市 场 上 颇 受 欢迎 。 


> 3. 1.2 相对 频数 分 布 和 百分数 频数 分 布 


相对 频数 分 布 是 各 组 相对 频数 数据 的 表格 汇总 , 指 某 一 类 别 ( 分 组 ) 所 占 总 数 的 比值 ( 比 
例 或 比率 ) 。 将 相对 频数 乘 以 100 就 是 百分数 频数 (百分比 ) 。 见 表 3-4 


表 3-4 样本 数据 的 相对 频数 和 百分数 频数 分 布 


饮料 相对 频数 百分数 频数 饮料 相对 频数 百分数 频数 
可 口 可 乐 0. 30 30% 芬 达 0. 12 12% 
健力宝 0. 22 22% a3 0. 18 18% 
百事 可 乐 0.18 18% 总 计 1. 00 100% 


> 3. 1.3 条 形 图 和 饼 形 图 


上 面 用 频数 分 布 表 表示 分 类 数据 的 频数 分 布 。 如 果 用 图 形 来 显示 频数 分 布 ,就 会 更 加 
形象 和 直观 。 

条 形 图 (bar chart) 是 用 宽度 相同 的 条 形 的 高 度 或 长 短 来 表示 数据 变动 的 图 形 。 条 形 图 
可 以 横 置 或 纵 置 , 纵 置 时 也 称 为 柱 形 图 。 图 3-2 是 根据 表 3-2 数据 绘制 的 条 形 图 。 

饼 形 图 (pie chart) 也 称 饼 图 、 圆 形 图 。 用 圆 形 及 圆 内 扇形 的 面积 来 表示 数值 大 小 的 图 
形 。 圆 形 图 主要 用 于 表示 总 体 中 各 组 成 部 分 所 占 的 比例 ,对 于 研究 结构 性 问题 十 分 有 用 。 
在 绘制 圆 形 图 时 ,总 体 中 各 部 分 所 占 的 百分比 用 圆 内 的 各 个 扇形 面积 表示 ,这 些 扇形 的 中 心 
角度 是 按 各 部 分 百分比 占 360" 的 相应 比例 确定 的 。 例 如 ,购买 可 口 可 乐 的 人 数 占 总 人 数 的 
百分比 为 30% ,那么 其 扇形 的 中 心 角度 就 应 为 360"X30% 三 108" ,其余 类 推 。 根 据 表 3-2 数 
据 绘 制 的 饼 形 图 如 图 3-3 所 示 。 

15} 
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图 3-2 饮料 样本 的 条 形 图 图 3-3 饮料 样本 的 饼 形 图 


统计 学 基础 (第 二 版 ) 


PANE 


用 Excel 创建 频数 分 布 表 的 步骤 


(1) 创建 Excel 文档 ,在 A2 到 A51 输入 表 3-1 数据 (本 示例 以 表 3-1 数据 为 例 ) 。 

(2) 为 不 同 品牌 饮料 指定 一 个 数字 代码 ,并 输入 到 B2 到 B51。 

(3) 选择 “数据 "菜单 选项 ,并 选择 “数据 分 析 ” 选 项 。 

提示 :如 果 在 “数据 ”菜单 选项 中 没有 “数据 分 析 ” 选 项 ,可 采用 以 下 方法 装 入 : 单 击 “ 工 
具 ” 下 拉 菜 单 中 的 选项 “加 载 宏 ”, 出 现 “ 加 载 宏 ”对 话 框 。 在 下 拉 列 表 中 ,找到 “分 析 数 据 库 ” 
选项 。 单 击 它 前 面 的 复 选 框 ,出 现 对 号 “VV”, 确 定 即 可 。 

(4) 在 “数据 分 析 ” 对 话 框 中 选择 “直方 图 ”命令 ,选择 “确定 ”。 

G) 当 出 现 对 话 框 时 : 


© 在 “输入 
@ 在 “接受 
© 在 “输出 


区 域 ” 方 框 内 选择 数据 区 域 (本 示例 是 B2:B51)。 
区 域 ” 方 框 内 选择 代码 区 域 ( 本 示例 是 E2:E6)。 


区 域 ? 方 框 内 选择 输出 结果 的 位 置 。 


@ 选择 “图 表 输 出 ”。 

© 选择 “确定 ”。 

为 了 便于 阅读 , 单 击 频数 分 布 表 中 的 有 “接受 ”字样 的 单元 格 ,输入 “饮料 品牌 ”代替 ; 同 
样 ,把 数值 代码 1、2、3、4、5 分 别 用 它们 对 应 的 品牌 名 称 蔡 换 。 例 如 ,1 替换 为 “可口可乐 ”,2 
替换 为 “健力宝 等 。 如 果 想 修改 图 表格 式 , 可 直接 双击 该 处 ,在 出 现 的 对 话 框 中 作 相应 的 
修改 。 
Excel 输出 的 结果 如 图 3-4 所 示 : 


A SP VED P O ST PY "I I 工 一 
1 饮料 品牌 RA 饮料 品牌 代码 
2 | 健力宝 2 anak 1 
3 a8 5 健力宝 2 
A fave 2 百事 可 乐 3 
5 pens 1 Be 4 
asar 3 a” 5 a 
| m 直方 图 
7 可口可乐 1 
| 14 
日 Bi 4 饮料 品牌 RE 12 
|o anag 1 可 口 可 乐 15| | =- 
io a 5 tae nj |e? 
10 | 6 
11 F04 1 百事 可 乐 9 4 
12 BOAR 1 BB 6 a 
1 o4 
1g | 健力宝 2 z2 9 FOUR RAS 百事 可 乐 FA SE 
14 BOAR 1 合计 50 nage 
| 百事可乐 3 


3-4 Excel 输出 的 结果 
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— 
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1. 下 面 给 出 了 部 分 数据 的 相对 频数 分 布 , 见 表 3-5. 
表 3-5 题 1 样本 数据 的 相对 频数 分 布 


分 类 相对 频数 分 类 相对 频数 
A 0.22 D 0.12 
B 0.16 E 0. 08 
c 0. 27 F 


C1) 分 类 下 的 相对 频数 是 多 少 ? 


(2) 如 果 样 本 容量 是 200, 分 类 下 的 频数 是 多 少 ? 
(3) 求 频数 分 布 。 
(4) 求 百 分 数 频 数 分 布 。 


2. 足球 报 提名 了 21 世纪 最 具 影 响 力 的 四 位 足球 明星 :贝克 汉 姆 (用 A 表示 ) AR 
H BRR) PARKE CRR) ERO DER). H 50 名 职业 人 士 、 媒 体 代 表 和 球 
迷 组 成 一 个 样本 对 这 四 名 球员 进行 投票 ,评选 最 具 代 表 性 的 明星 代表 。 投 票 结果 见 


表 3-6。 
表 3-6 投票 结果 
A A B È D A B A A G 
B A A € B € A A B Ẹ 
A A B A c D A A G D 
B A È D A A A @ D A 
加 B A A B € D A A c 


(1) 这 些 数据 是 分 类 型 数据 还 是 数量 型 数据 ? 


(2) 编制 这 些 数 据 的 频数 分 布 和 百分数 频数 分 布 。 


(3) 绘制 这 些 数据 的 条 形 图 和 人 饼 图 。 
(4) 以 投票 数据 为 依据 , 哪 位 球员 是 明星 代表 ? 


[3. 2 数值 型 数据 的 汇总 | 


> 3.2.1 


频数 分 布 


正如 3. 1 节 定 义 的 那样 ,频数 分 布 是 表示 在 几 个 互 不 重合 的 组 中 每 一 组 所 包含 的 项 目 
个 数 (或 频数 ) 的 表格 汇总 。 这 个 定义 也 适用 于 数值 型 数据 。 然 而 ,对 于 数值 型 数据 ,在 将 互 


不 重合 的 组 用 于 频数 分 布 时 ,我 们 必须 要 更 加 慎重 。 


表 3-7 是 某 次 英语 测试 成 绩 数 据 。 


Om 
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表 3-7 英语 测试 成 绩 


117 122 124 129 139 107 ING 130 122 125 
108 131 125 117 122 133 126 122 118 108 
110 118 123 126 133 134 127 123 118 112 
112 134 127 123 119 113 120 123 127 135 
137 114 120 128 124 115 139 128 124 121 


下 面 ,我 们 通过 编制 表 3-7 的 频数 分 布 来 演示 这 些 步 骤 。 

1. 单 变量 值 分 组 

单 变量 值 分 组 是 把 每 一 个 变量 值 作为 一 组 ,这 种 分 组 方法 通常 只 适合 于 离散 变量 且 变 
量 值 较 少 的 情况 。 

为 便于 分 组 ,可 先 对 上 面 的 数据 进行 排序 ,结果 见 表 3-8。 


表 3-8 英语 测试 成 绩 排 序 表 


107 108 108 110 112 112 113 114 115 I7 
117 117 118 118 118 119 120 120 121 122 
122 122 122 123 123 123 123 124 124 124 
125 125 126 126 127 127 127 128 128 129 
130 131 133 133 134 134 135 137 139 139 


采用 单 变量 值 分 组 形成 的 频数 分 布 见 表 3-9 。 
表 3-9 英语 测试 成 绩 分 组 表 


测试 成 绩 频数 (人 ) 测试 成 绩 频数 (人 ) 测试 成 绩 频数 (人 ) 
107 1 119 1 128 2 
108 2 120 2 129 1 
110 j 121 1 130 1 
2 2 122 4 131 1 
113 1 123 4 133 2 
114 1 124 3 134 2 
115 1 125 2 135 1 
iiy 3 126 2 137 1 
118 3 127 3 139 2 
从 表 3-9 可 以 看 出 ,在 数据 较 多 的 情况 下 , 单 变量 值 分 组 由 于 组 数 较 多 ,不 便于 观察 数 


据 分 布 的 特征 和 规律 ,而 且 对 于 连续 变量 也 无 法 采用 这 种 分 组 方法 。 

2. 组 距 分 组 

在 连续 变量 或 变量 值 较 多 的 情况 下 ,可 采用 组 距 分 组 , 它 是 将 全 部 变量 值 依次 划分 为 车 
干 个 区 间 , 并 将 这 一 区 间 的 变量 值 作为 一 组 。 在 组 距 分 组 中 ,一 个 组 的 最 小 值 称 为 下 限 (low 


—o 
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limit) ,最 大 值 称 为 上 限 (upper limit) 。 采 用 组 距 分 组 需要 经 过 以 下 几 个 步骤 : 

(1) 确定 组 数 。 一 组 数据 分 多 少 个 组 合适 ? 这 一 般 与 数据 本 身 的 特点 及 数据 的 多 少 有 
关 。 由 于 分 组 的 目的 是 为 了 观察 数据 分 布 的 特征 ,因此 组 数 应 适中 。 若 组 数 太 少 ,数据 的 分 
布 就 会 过 于 集中 ;而 组 数 太 多 ,数据 的 分 布 就 会 过 于 分 散 ,这 都 不 便于 观察 数据 分 布 的 特征 
和 规律 。 组 数 的 确定 应 以 能 够 显示 数据 的 分 布 特征 和 规律 为 目的 。 

在 实际 分 组 时 ,可 以 按 Sturges 提出 的 经 验 公式 来 确定 组 数 K : 


— 14/18" 3 
K-i (3-1) 


在 式 (3-1) 中 ,n 为 数据 的 个 数 ,对 结果 用 四 舍 五 人 的 办 法 取 整 数 即 为 组 数 。 例 如 ,对 
表 3-7 进 行 分 组 整理 ,根据 式 (3-1) 开 =1 十 lg50 二 lg2<7, 数 据 集 可 分 为 7 个 组 。 当 然 ,这 只 
是 一 个 经 验 公 式 ,实际 应 用 时 ,可 根据 数据 的 多 少 和 特点 及 分 析 的 要 求 , 参 考 这 一 标准 灵活 
确定 组 数 。 

(2) 确定 各 组 的 组 距 。 组 距 (class width) 是 一 个 组 的 上 限 与 下 限 之 差 ,可 根据 全 部 数据 
的 最 大 值 和 最 小 值 及 所 分 的 组 数 来 确定 。 

组 距 一 (最 大 值 一 最 小 值 ) 二 组 数 (3-2) 

例如 , 表 3-7 的 数据 集中 最 大 值 为 139, 最 小 值 为 107, 则 组 距 王 (139 一 107) +7=4. 6, 
为 便于 计算 ,组 距 宜 取 5 或 10 的 倍数 ,而 且 第 一 组 的 下 限 应 低 于 最 小 变量 值 , 最 后 一 组 的 上 
限 应 高 于 最 大 变量 值 ,因此 组 距 可 取 5。 

对 表 3-9 进行 分 组 整理 ,可 得 到 分 组 整理 的 频数 分 布 表 , 见 表 3-10。 


表 3-10 英语 测试 成 绩 分 组 表 


测试 成 绩 分 组 频数 (人 ) 测试 成 绩 分 组 频数 (人 ) 
105 一 110 3 125~130 10 
110 一 115 5 130~135 6 
115~120 8 135~140 4 
120~125 14 合计 50 


采用 组 距 分 组 时 ,一 定 要 遵循 “不 重 不 漏 ” 的 原则 。“ 不 重 ” 指 一 个 数据 只 能 分 在 其 中 的 
某 一 组 ,不 能 在 其 他 组 中 重复 出 现 ;“ 不 漏 ”是 指 在 所 分 的 全 部 组 中 每 个 数据 都 应 包含 在 某 一 
分 组 中 ,不 能 遗漏 。 

为 解决 “不 重 ” 的 问题 ,统计 分 组 时 习惯 上 规定 “上 组 限 不 在 内 ”, 即 当 相 邻 两 组 的 上 下 限 
重 友 时 ,恰好 等 于 某 一 组 上 限 的 变量 值 不 统计 在 本 组 内 ,而 计算 在 下 一 组 内 。 例 如 ,在 
K 3-10 的 分 组 中 ,120 这 一 数值 不 计算 在 115 一 120 这 一 组 内 ,而 计算 在 120 一 125 组 中 ,其 

在 组 距 分 组 中 ,如 果 全 部 数据 中 的 最 大 值 和 最 小 值 与 其 他 数据 相差 悬殊 ,为 避免 出 现 空 
白 组 ( 即 没有 变量 值 的 组 ) 或 个 别 极端 值 被 漏 掉 ,第 一 组 和 最 后 一 组 可 以 采用 "一 以 下 ?或 者 
“一 以 上 ”这 样 的 开口 组 ,以 解决 “不 漏 ”问题 。 例 如 ,在 表 3-7 的 50 个 数据 中 ,假定 将 最 小 值 
改 为 94, 最 大 值 改 为 160. 采 用 上 面 的 分 组 就 会 出 现 “ 空 白 组 ”, 这 时 可 采用 开口 组 来 统计 , 见 


表 3-11。 
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表 3-11 英语 测试 成 绩 分 组 表 


测试 成 绩 分 组 频数 (人 ) 测试 成 绩 分 组 频数 (人 ) 
110 以 下 3 125 一 130 10 
110~115 EB 130 一 135 6 
115~120 8 135 以 上 4 
120~125 14 合计 50 


在 组 距 分 组 时 ,如 果 各 组 的 组 距 相等 则 称 为 等 距 分 组 ,如 上 面 的 分 组 就 是 等 距 分 组 。 有 
时 ,对 于 某 些 特殊 现象 或 为 了 特定 研究 的 需要 ,各 组 的 组 距 也 可 以 是 不 相等 的 , 称 为 不 等 距 
分 组 。 比 如 ,对 人 口 年 龄 的 分 组 ,可 根据 年 龄 分 布 特点 分 为 0 一 6 岁 ( 婴 幼儿 组 ).7 一 17 岁 ( 少 
年 儿童 组 ) 18 一 59 岁 ( 中 青年 组 )、60 岁 以 上 (老年 组 ) 等 。 
组 距 分 组 有 可 能 会 掩盖 了 各 组 内 的 数据 分 布 特征 ,为 反映 各 组 数据 的 一 般 水 平 , 我 们 通 
常用 组 中 值 (class midpoint) 作 为 该 组 数据 的 一 个 代表 值 。 
组 中 值 =( 下 限 值 十 上 限 值 )/2 (3-3) 
组 中 值 的 计算 有 一 个 必要 的 假设 条 件 , 即 各 组 数据 的 在 本 组 内 呈 均 匀 分 布 或 在 组 中 值 两 
侧 呈 对 称 分 布 。 如 果实 际 数据 的 分 布 不 符合 这 一 假定 ,用 组 中 值 作为 一 组 数据 的 代表 值 会 有 
一 定 的 误差 。 表 3-10 各 分 组 的 组 中 值 分 别 是 112. 5,117. 5,122. 5,127. 5,132. 5,137. 5。 


> 3.2.2 累计 分 布 


为 了 统计 分 析 的 需要 ,有 时 需要 计算 累计 频数 .累计 比例 或 者 累计 百分比 。 

累积 频数 (cumulative frequencies) 是 将 各 类 别 的 频数 逐 级 累加 。 一 般 有 两 种 情形 :一 是 
从 类 别 顺序 的 开始 一 方向 类 别 顺 序 的 最 后 一 方 累加 频数 (从 变量 值 最 小 的 一 方向 变量 值 最 
大 的 一 方 累 加 频数 ) , 称 为 向 上 累积 ;二 是 从 类 别 顺 序 的 最 后 一 方向 类 别 顺 序 的 开始 一 方 累 
加 频数 (从 变量 值 最 大 的 一 方向 变量 值 最 小 的 一 方 累 加 频数 ) , 称 为 向 下 累积 。 通 过 累积 频 
数 , 可 以 很 容易 看 出 某 一 类 别 ( 或 数值 ) 以 下 及 某 一 类 别 ( 或 数值 ) 以 上 的 频数 之 和 。 

累积 比例 或 百分比 Ccumulative percentages) 是 将 各 类 别 比例 或 百分比 逐 级 累加 起 来 ， 
也 有 向 上 累积 和 向 下 累积 两 种 方法 。 

K 3-12 是 一 项 有 关 住房 问题 的 研究 ,研究 人 员 在 北京 .上 海 两 个 城市 各 抽样 调查 300 
户 家 庭 , 其 中 的 一 个 问题 是 “您 对 您 家 庭 目 前 的 住房 状况 是 否 满意 ?”" 有 5 个 选项 


(1) 非常 不 满意 ;(2) 不 满意 ;(3) 一 般 ;(4) 满 意 ;(5) 非 常 满意 。 调 查 汇总 见 表 3-12 MK 3-13。 
表 3-12 北京 市 家 庭 对 住房 状况 的 评价 
向 上 累积 向 下 累积 
加 il 户 数 ( 户 ) 分 比 (%) 
vere i iiia 户 数 ( 户 ) 百分比 (%) 户 数 ( 户 ) 百分比 (%) 
非常 不 满意 24 8 24 8.0 300 100 
不 满意 108 36 132 44.0 276 92 
一 般 93 31 225 75.0 168 56 
满意 45 15 270 90. 0 75 25 
非常 满意 30 10 300 100.0 30 10 
合 计 300 100 一 一 一 一 


一 一 0 
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表 3-13 上 海 市 家 庭 对 住房 状况 的 评价 


回答 类 别 | 户 数 ( 户 ) | 百分比 (%) sac TEN 
户 数 ( 户 ) 百分比 (%) 户 数 ( 户 ) 百分比 (%) 
非常 不 满意 21 7.0 21 7.0 300 100.0 
不 满意 99 33.0 120 40.0 279 93.0 
一 般 78 26.0 198 66.0 180 60.0 
满意 64 21.3 262 87.3 102 34.0 
非常 满意 38 12.7 300 100. 0 38 12.7 
合 计 300 100.0 


3.2.3 直方 图 和 折线 图 


(1) 直方 图 (histogram)。 直 方 图 是 用 和 矩形 的 宽度 和 高 度 来 表示 频数 分 布 的 图 形 。 在 平 

面 直角 坐标 中 , 横 轴 表示 数据 分 组 , 纵 轴 表示 频数 或 比例 ,这 样 ,各 组 与 相应 的 频数 就 形成 了 
一 个 矩形 , 即 直方 图 。 例 如 ,根据 表 3-10 的 数据 绘制 的 直方 图 如 图 3-5 所 示 。 
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频数 


0 
105~ 110 110~115 115 ~ 120 120~ 125 125 ~ 130 130 一 135 135~ 140 
测试 成 绩 分 组 
图 3-5 英语 测试 成 绩 直 方 图 


从 直方 图 可 以 直观 地 看 出 英语 测试 成 绩 的 人 数 分 布 的 特点 ,测试 成 绩 在 120 一 125 之 间 
的 人 数 最 多 ,105 一 110 之 间 的 人 数 最 少 。 

直方 图 与 条 形 图 不 同 ,条 形 图 是 用 条 形 的 高 度 表 示 各 类 别 频 数 的 多 少 ,宽度 是 固定 的 。 
直方 图 是 用 面积 表示 各 组 频数 的 大 小 ,矩形 的 高 度 表示 每 一 组 的 频数 或 百分比 ,宽度 则 表示 
各 组 的 组 距 , 因 此 其 高 度 与 宽度 均 有 意义 。 此 外 ,由 于 分 组 数据 具有 连续 性 ,直方 图 的 各 拢 
形 通常 是 连续 排列 ,而 条 形 图 则 是 分 开 排列 。 

(2) 折 线 图 。 折 线 图 也 称 频数 多 边 形 图 (frequency polygon)。 在 直方 图 的 基础 上 ,把 直 
方 图 项 部 的 中 点 ( 即 组 中 值 ) 用 直线 连接 起 来 ,再 把 原来 的 直方 图 抹 掉 , 余 下 的 就 是 折线 图 。 
需要 注意 ,折线 图 的 两 个 终点 要 与 横 轴 相交 ,具体 的 做 法 是 将 第 一 个 矩形 顶部 中 点 通过 坚 边 
中 点 ( 即 该 组 频数 一 半 的 位 置 ) 连 接 到 横 轴 ,最 后 一 个 矩形 顶部 中 点 与 其 竖 边 中 点 连接 到 横 
轴 。 这 样 才 会 使 折线 图 下 所 围 成 的 面积 与 直方 图 的 面积 相等 ,从 而 使 二 者 所 表示 的 频数 分 


o— 
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布 一 致 。 图 3-6 是 表 3-10 分 组 数据 的 折线 图 。 
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105~110 110~ 115 115~ 120 120~ 125 125~ 130 130~ 135 135~140 
图 3-6 英语 测试 成 绩 折线 图 
当 数 据 组 数 很 多 时 ,组 距 会 越 来 越 小 ,这 时 所 绘制 的 折线 图 就 会 越 来 越 平滑 ,逐渐 形成 
一 条 平滑 的 曲线 ,这 就 是 频数 分 布 曲 线 。 分 布 曲线 在 统计 学 中 有 着 广泛 的 应 用 ,是 描述 各 种 
统计 量 和 分 布 规律 的 有 效 方法 。 


3.2.4 累计 曲线 


累计 分 布 的 图 形 表示 称 为 累计 曲线 (ogive) ,在 横 轴 上 显示 数值 ,在 纵 轴 上 显示 累计 频 
数 或 累计 比例 .累计 百分数 。 图 3-7 是 表 3-7 数据 集 的 累计 频数 曲线 。 


6 、 _ 120% 
mm 界 计 百分比 一 0 一 累计 频数 
33 50 100% 
& 
tn 40 80% 
S 
B30 60% 
+ 
ae 20 40% 
10 20% 


105~ 110110~ 115115~ 120120~ 125125 ~130130~135135~140 
英语 测试 成 绩 分 组 


3-7 英语 测试 成 绩 的 累计 曲线 


这 
站 


3. 见 表 3-14 
表 3-14 题 3 表 
14 21 23 21 16 19 22 25 16 16 
24 24 25 19 16 19 18 19 21 12 
16 17 18 23 25 20 23 16 20 19 
24 26 15 22 24 20 22 24 22 20 
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(1) 利用 组 12~14,15~17,18~20,21~23 和 24~26 来 编制 频数 分 布 。 

(2) 编制 (1) 题 的 相对 频数 分 布 和 百分数 频数 分 布 。 

(3) 编制 分 组 (1) 的 累积 频数 .累积 百分数 表 。 

(4) 绘制 数据 的 直方 图 和 累积 曲线 。 

4. 银行 经 理 研 究 了 需要 办 理 业 务 的 客户 到 达 银 行 后 的 等 待 时 间 。 下 面 是 一 个 月 的 期 
间 内 搜集 的 等 待 时 间 数 据 (单位 :分 钟 ) 。 

SEW Wd tg MW ngan Mae eT B Bw 2 

(1) 为 数据 分 组 并 编制 频数 分 布 。 

(2) 编制 相对 频数 分 布 。 

G) 编制 累积 频数 分 布 。 

(4) 等 待 办 理 业 务 时 间 不 超过 9 分 钟 的 比例 是 多 少 ? 


>3.2.5 mK 


直方 图 能 大 体 上 观察 出 一 组 数据 的 分 布 状况 ,但 直方 图 没有 给 出 具体 的 数值 。 茎 叶 图 (stenr 
and-leaf display) 婚 给 出 数据 的 分 布 状况 ,又 给 出 每 一 个 原始 数值 ,是 数据 最 直观 的 展示 图 形 。 

茎 叶 图 由 “ 茎 "和 *“ 叶 ”两 部 分 构成 ,其 图 形 是 由 数字 组 成 的 。 通 过 茎 叶 图 ,可 以 看 出 数据 
的 分 布 形状 及 数据 的 离散 状况 ,比如 ,分 布 是 否 对 称 , 数 据 是 否 集中 ,是 否 存 在 极端 值 等 。 绘 
制 茎 叶 图 的 关键 是 设计 好 树 茎 ,通常 是 以 该 组 数据 的 高 位 数值 作为 树 蕉 。 树 茎 一 经 确定 , 树 
叶 就 自然 地 长 在 相应 的 树 茎 上 了 o 

为 了 绘制 树叶 显 示 图 ,我 们 首先 把 每 个 数值 的 高 位 数字 排 在 竖 线 左 侧 , 在 竖 线 右边 , 记 
录 每 个 数据 值 的 最 后 一 位 数字 。 例 如 ,数值 110 的 高 位 数字 11 在 竖 线 左边 ,最 后 一 位 数字 0 
在 竖 线 右边 。 这 样 组 织 数据 后 ,对 竖 线 右边 的 每 一 行 数字 进行 排序 。 图 3-8 是 表 3-7 数据 集 
WEIS 

10|7 8 8 

ufo223457778889 
2J001222233334445566777889 
3/0133445799 


图 3-8 英语 测试 成 绩 的 茎 时 图 


如 图 3-7 所 示 , 竖 线 右边 的 数字 10、11、12、13 是 葵 , 竖 线 右边 的 每 一 个 数字 是 叶 。 
根据 蔡 叶 图 ,我 们 用 一 个 长 方形 围 住 每 一 个 荃 的 叶 。 这 样 我们 得 到 图 3-9 。 


如 果 将 上 图 逆 时 针 旋 转 90 BE. Ar 4 BAY AB 4G 105 ~ 110,110 ~ 115, 115 ~ 120, 
120~125 .125~130,130~135,135~ 140 4R WH BARRA. TU. See 
易于 手工 绘制 mi AA eT EJ SO RE T RGE A & BY bs fa 
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3.2.6 散 点 图 和 趋势 线 


散 点 图 (scatter diagram) 是 两 个 变量 之 间 关 系 的 图 形 表述 ,为 探索 两 个 变量 间 关 系 提供 
了 非常 好 的 视角 。 

散 点 图 使 用 数据 值 作为 x.y 坐标 来 绘制 点 。 它 可 以 揭示 格 网 上 所 绘制 的 值 之 间 的 关 
系 ,还 可 以 显示 数据 的 趋势 。 当 存在 大 量 数据 点 时 , 散 点 图 的 作用 尤为 明显 。 散 点 图 与 折线 
图 相似 ,而 不 同 之 处 在 于 折线 图 通过 将 点 或 数据 点 相连 来 显示 每 一 个 变化 。 表 3-14 是 某 商 
场 的 促销 广告 次 数 与 销售 额 之 间 的 样本 数据 。 该 商场 在 过 去 的 三 个 月 通过 在 报纸 派发 免费 
购物 券 的 广告 来 促销 。 管 理 人 员 想 证 实 广告 的 促销 次 数 和 下 一 周 商 场 的 销售 额 之 间 是 否 存 
在 关系 。 表 3-15 给 出 了 10 周 销售 额 的 样本 数据 (单位 :万 元 ) 。 


表 3-15 商场 广告 次 数 与 销售 额 样本 数据 单位 :万 元 
周 广告 次 数 销售 额 周 广告 次 数 s 
1 2 50 6 1 38 
2 5 57 7 5 63 
3 1 41 8 3 48 
4 3 54 9 4 59 
5 4 54 10 2 46 


图 3-10 所 示 是 表 3-15 数据 的 散 点 图 和 趋势 线 。 广 告 次 数 (z) 显 示 在 横 轴 上 ,销售 额 
(y) 显 示 在 纵 轴 上 。 对 第 一 周 ,+ 二 2 和 y 一 50, 在 散 点 图 上 按 这 两 个 坐标 画 出 该 点 。 用 相 
同 的 方法 画 出 其 他 9 周 的 点 。 注 意 , 有 两 周 做 了 一 次 广告 ,有 两 周 做 了 两 次 广告 ,以 此 
类 推 。 


广告 次 数 
图 3-10 广告 次 数 与 销售 量 样本 数据 散 点 图 和 趋势 线 


绘制 好 的 散 点 图 表明 ,广告 次 数 和 销售 额 之 间 存在 正 相 关 关系 。 较 高 的 销售 额 与 较 高 
的 广告 次 数 相 联系 。 因 为 所 有 的 点 并 不 在 一 条 直线 上 ,所 以 这 种 关系 是 不 完全 的 。 然 而 ,这 
些 点 的 分 布 模式 和 趋势 线 表明 ,整体 关系 是 正 相关 的 。 


—o 


项目 3 ”数据 的 整理 与 图 示 i l 


(33 “频数 分 布 的 类 型 | 3 ”频数 分 布 的 类 型 


常见 的 频数 分 布 曲线 主要 有 对 称 分 布 和 偏 态 分 布 。 如 图 3-11 所 示 。 


右 偏 左 偏 


JIAN JS 


=- =- -= 


(a) 对 称 分 布 (b) 偏 态 分 布 
图 3-11 频数 分 布 曲线 
对 称 分 布 是 一 种 形 曲线 ,有 很 多 现象 服从 这 种 分 布 , 如 农作物 的 单位 面积 产量 .零件 的 
误差 ,纤维 强度 等 都 服从 对 称 分 布 ,实际 上 ,对 称 分布 只 是 一 种 理想 的 状态 ,在 实际 中 总 是 会 
存在 偏差 ,如 果 偏 差 较 大 ,这 时 候 用 偏 态 分 析 更 符合 实际 ,下 一 章 有 具体 的 讨论 。 


wD 


5. Sethi T I Bee Ent FAL 
11.3 9.6 10.4 7.5 8&3 10.5 10 9.3 81 7.7 7.5 84 63 8&8 
6. 研究 人 员 测 定 了 一 类 植物 的 含 氧 量 ,用 于 药物 研制 。 得 到 的 测试 数据 如 下 : 


114 90 131 124 117 98 104 144 151 132 


102 106 127 119 115 106 125 122 118 118 


(1) 为 数据 分 组 并 编制 频数 分 布 。 

(2) 绘制 数据 的 茎 叶 图 。 

7. R 3-16 的 数据 是 两 个 变量 x+ 和 > 的 30 次 观测 结果 。z 的 分 类 是 A、B、C;y 的 分 类 
是 1 和 2。 


表 3-16 变量 x 和 y 的 观测 结果 


观测 次 数 z y 观测 次 数 去 m 
F A 1 16 B 2 
2 B 1 17 € 3 
k] B 1 18 B ii 
4 G 2 19 E 3 
§ B 1 20 B a 
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续 表 
观测 次 数 工 y 观测 次 数 z y 
6 © 2 21 [对 2 
7 B 1 22 B 1 
8 c 2 23 € 2 
9 A 1 24 A 1 
10 B 1 25 B 1 
11 A 1 26 C 2 
12 B 1 27 € 2 
13 iC 2 28 A 1 
14 C 2 29 B 1 
15 Q 2 30 B 2 


(1) M x 为 行 变 量 ,y 为 列 变量 ,编制 数据 的 交叉 分 组 表 。 
(2) 计算 行 百 分 比 。 
(3) 计算 列 百分比 。 
(4) 绘制 x 和 y 的 散 点 图 ,并 描述 两 个 变量 之 间 的 关系 。 


doth 


对 于 一 个 数据 集 , 即 使 它 的 规模 适中 ,对 其 原始 形式 直接 解释 往往 也 很 困难 。 统 计 表 和 
图 形 提供 了 整理 和 汇总 数据 的 方法 ,揭示 出 数据 的 特征 ,并 能 更 容易 地 解释 数据 。 图 3-12 
是 本 章 介 绍 的 汇总 数据 的 方法 。 


FAAN Oek, HO) 
> Al ` 
分 类 型 数据 交叉 分 组 表 
条 形 图 


频数 分 布 


- 百分数 频数 分 布 
统计 表 - 累计 频数 分 布 

- 累计 相对 频数 〈 比 率 、 比 例 ) 分 布 
统计 图 


数据 一 | 相对 频数 (比率 、 比 例 ) 分 布 
累计 百分数 频数 分 布 
数值 型 数据 交叉 分 组 表 
直方 图 
R 累计 曲线 
散 点 图 


图 3-12 汇总 数据 的 方法 


项 H 4 


”数据 的 概括 性 测度 


项 目 4 数据 的 概括 性 测度 上 


>> > | 实践 中 的 统计 
美 特 斯 公司 账 期 的 统计 量 


美 特 斯 公司 成 立 于 2004 年 ,是 一 家 设计 和 进出 口 婴 儿 产 品 的 公司 , 主 营 玩具 和 附属 用 
品 。 公 司 的 产品 包括 悬挂 饰物 .宝贝 驴 、 音 乐 玩 具 、 拨 浪 鼓 和 安全 地 垫 , 以 及 设计 注重 颜色 、 
材质 和 音质 的 高 品质 毛线 玩具 。 公 司 的 产品 设计 在 韩国 ,在 国内 生产 。 

美 特 斯 公司 使 用 独立 的 销售 代理 ,把 产品 分 销 给 婴儿 用 品 零 售 商 \ 儿 童 用 品 及 服饰 商 
店 、 礼 品 店 、 大 型 百货 商场 和 指定 的 网 店 。 

在 这 家 公司 的 正常 运营 中 ,现金 流量 管理 是 最 重要 的 经 营 活动 之 一 。 能 否 保 证 公司 拥 
有 足够 的 现金 收入 ,以 满足 目前 和 未 来 的 偿 债 义务 ,决定 着 公司 业务 的 成 败 。 现 金 流量 的 管 
理 的 一 个 关键 因素 是 对 应 收 账 款 的 分 析 和 控制 。 通 过 度量 未 付款 发 票 的 平均 期 限 和 资金 数 
HR ,管理 人 员 能 够 预测 现金 供应 和 监测 应 收 款 状态 的 变化 。 公 司 设置 了 以 下 目标 :未 付款 发 
票 的 平均 期 限 不 应 超过 45 天 ;超过 60 天 的 未 付款 发 票 的 资金 数额 不 应 超过 所 有 应 收 账 款 
总 额 的 5%。 

在 最 近 对 应 收 账 款 的 汇总 中 ,该 公司 使 用 了 下 面 的 描述 统计 量 来 衡量 未 付款 发 票 的 
期 限 : 


平均 数 40K 中 位 数 35K te BK BLK 

对 这 些 统计 量 的 解释 表明 ,一 张 发票 的 平均 数 或 平均 期 限 是 40 天 ;中 位 数 表明 有 一 半 
的 发 票 已 经 超过 35 天 没有 付款 ;最 常见 的 发 票 期 限 是 众 数 31 天 ,表示 一 张 未 付款 发 票 最 常 
见 的 时 间 长 度 是 31 天 。 统 计 汇 总 还 显示 出 应 收 款 总 额 中 只 有 3% 超过 60 天 。 基 于 这 些 统 
计 信 息 , 管 理 人 员 认 为 应 收 账 款 和 收入 现金 流 都 处 于 控制 之 中 。 

在 上 述 案 例 中 , 美 特 斯 公司 使 用 了 一 些 描述 统计 量 。 除 了 平均 数 、 中 位 数 和 众 数 外 ,本 
项 目 中 我 们 还 要 介绍 其 他 的 一 些 描述 统计 量 , 这 些 数值 的 测度 有 助 于 我 们 更 好 地 理解 和 解 
释 数 据 。 

对 统计 数据 的 测度 和 描述 ,一 是 分 布 的 集中 趋势 ,反映 各 数据 向 其 中 心 值 靠拢 或 聚集 的 
程度 ,如 算术 平均 数 ;二 是 分 布 的 离 中 趋势 ,反映 各 数据 远离 其 中 心 值 的 程度 ,如 标准 差 ;三 
是 分 布 的 偏 态 和 峰 度 ,反映 数据 分 布 的 形状 。 这 三 个 方面 分 别 反映 了 数据 分 布 特征 的 不 同 
侧面 。 


[4. 1 集中 趋势 的 测度 | 1 集中 趋势 的 测度 


集中 趋势 是 指 一 组 数据 向 其 中 心 值 靠拢 的 倾向 ,测度 集中 趋势 也 就 是 寻找 数据 一 般 水 
平 的 代表 值 或 中 心 值 。 取 得 集中 趋势 代表 值 的 方法 通常 有 两 种 :一 是 从 总 体 各 单位 变量 值 
中 抽象 出 具有 一 般 水 平 的 量 , 这 个 量 不 是 各 个 单位 的 具体 变量 值 , 但 又 要 反映 总 体 各 单位 的 
一 般 水 平 ,这 种 平均 数 称 为 数值 平均 数 。 数 值 平均 数 有 算术 平均 数 、 调 和 平均 数 、 几 何平 均 
数 等 形式 。 二 是 先 将 总 体 各 单位 的 变量 值 按 一 定 顺序 排列 ,然后 取 某 一 位 置 的 变量 值 来 反 
映 总 体 各 单位 的 一 般 水 平 , 把 这 个 特殊 位 置 上 的 数值 看 作 是 平均 数 , 称 作 位 置 平 均 数 。 位 置 
平均 数 有 众 数 、 中 位 数 、 四 分 位 数 等 形式 。 

全 一 一 一 
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> 4.1.1 平均 数 


由 平均 数 


平均 数 (mean) 是 观测 值 的 总 和 除 以 观测 值 个 数 的 商 ,是 数据 中 心 位 


FLAY BE HE 
假设 zi ,x:，,… ,zx 是 第 一 个 观测 值 到 第 ”个 样本 观测 值 的 集合 ,其 
样本 平均 数 的 计算 公式 如 下 


z=% ite e >ja 
n 


(4-1) 


为 了 说 明 样 本 平均 数 的 计算 , 表 4-1 是 24 名 IT 从 业者 年 薪 收 入 组 成 一 个 样本 。 
表 4-1 24 名 IT 从 业 人 员 年 薪资 料 表 


49 100 48 600 49 950 48 800 47 200 49 900 51 350 54 600 
49 300 51 200 51 000 49 400 51 400 51 800 49 600 53 400 
48 700 50 300 49 000 49 800 48 900 48 650 51 300 51 900 


计算 IT 从 业 人 员 样 本 的 平均 年 薪 。 
根据 公式 计算 如 下 


2 BHO ib soe 4-53 5 
平均 年 薪 二 =I _ 49 100+ 49 300 sie +53 400 +51 900 _ 
式 (4-1) 说 明了 有 个 观测 值 样本 平均 数 的 计算 。 而 总 体 平均 数 的 计算 也 基本 相同 。 
但 我 们 使 用 不 同 符号 表示 总 体 平均 数 的 计算 。 用 N 表示 总 体 观测 值 的 个 数 ,yx 表示 总 体 
均 数 。 计 算 公 式 如 下 


50 214. 58( 元 ) 


K 


= A € 
way lam (4-2) 


E 加 权 算 术 平 均 数 


加 权 算术 平均 数 (weighted arithmetic mean) 是 根据 分 组 整理 的 数据 计算 的 算术 平均 
数 。 其 计算 公式 为 


pe ahitnat tet 2a ai 
fitht~+h. py; 
IUP , f 代表 各 组 变量 值 出 现 的 频数 。 
K 4-2 是 50 名 工人 加 工 零 件数 的 数据 分 组 表 ,计算 人 均 日 产量 。 
表 4-2 某 企业 50 名 工人 加 工 零 件 均值 计算 表 
接替 件数 分 组 组 中 值 频数 了 =f 
105~110 107.5 3 322.5 
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= 


续 表 
按 零 件数 分 组 组 中 值 x 频数 了 af 
110~115 112.5 5 562.5 
115~120 117.5 8 940.0 
120~125 122.5 14 1715.0 
125~130 127.5 10 1275.0 
130~135 132.5 6 795. 0 
135 一 140 137.5 4 550. 0 
合 H = 50 6 160.0 
平均 日 产量 = Ze = S160 — 123.2( 件 ) 
x 


这 种 根据 已 分 组 整理 的 数据 计算 的 均 数 就 称 为 加 权 算 术 平 均 数 。 这 时 ,平均 数 的 大 小 ， 
不 仅 取决 于 研究 对 象 的 变量 值 ,而 且 受 各 变量 值 重 复出 现 的 频数 大 小 的 影响 ,如 果 某 一 组 的 
频数 较 大 ,说 明 该 组 的 数据 较 多 ,那么 该 组 数据 的 大 小 对 算术 平均 数 的 影响 就 大 ,反之 则 小 。 
可 见 各 组 频数 的 多 少 对 平均 的 结果 起 着 一 种 权衡 轻重 的 作用 ,因而 这 一 衡量 变量 值 相 对 重 
要 性 的 数值 称 为 权 数 。 这 里 所 谓 权 数 的 大 小 ,并 不 是 以 权 数 本 身 值 的 大 小 而 言 的 ,而 是 指 各 
组 单位 数 占 总 体 单位 数 的 比重 , 即 权 数 系数 (f/ DS )。 权 数 系数 亦 称 为 频率 ,是 一 种 结构 
相对 数 。 


E 平均 数 性 质 


平均 数 在 统计 学 中 具有 重要 的 地 位 , 它 是 进行 统计 分 析 和 统计 推断 的 基础 。 首 先 , 从 统 
计 思想 上 看 , 它 是 一 组 数据 的 重心 所 在 ,是 数据 误差 相互 抵消 后 的 必然 性 结果 。 比 如 对 同一 
观测 对 象 进行 多 次 测量 , 若 所 得 结果 不 一 致 ,可 能 是 由 于 测量 误差 所 致 ,也 可 能 是 其 他 因素 
的 偶然 影响 ,利用 算术 平均 数 作为 其 代表 值 , 则 可 以 使 误差 相互 抵消 ,反映 出 事物 必然 性 的 
数量 特征 。 


用 Excel 计算 平均 数 (以 计算 某 班 各 科 考 试 平 均 成 绩 为 例 ) 。 
方法 一 : 


A) 打开 Excel, 输 入 全 班 每 位 同学 各 科 考 试 成 绩 ( 一 般 以 每 行 记录 一 名 学 生 的 各 科 成 
绩 ,也 可 以 每 列 记录 一 名 学 生 的 各 科 成 绩 ) 。 

(2) 选择 “工具 ”下 拉 菜 单 。 

(3) 选择 “数据 分 析 ” 选 项 。 

(4) 从 弹出 的 “分 析 工 具 ” 中 选择 “描述 统计 ”选项 .并 按 “ 确 定 ”。 

(5) 在 对 话 框 中 的 “输入 区 域 ” 框 内 选择 要 计算 的 单元 格 区 域 (如 果 包 括 字段 行 , 则 须 
选中 “标志 位 于 第 一 行 ” 复 选 框 。 若 分 组 方式 为 逐 行 , 则 该 复 选 框 选 定 标志 位 于 第 一 列 )， 
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在 “输出 选项 ”中 选择 输出 区 域 ;选择 汇总 统计 ”( 该 选项 给 出 全 部 描述 统计 量 ); 最 后 按 
“确定 ”。 

方法 三 : 

A) 打开 “Excel”, 输 入 全 班 每 位 同学 各 科 考 试 成 绩 ( 一 般 以 每 行 记录 一 名 学 生 的 各 科 成 
绩 , 也 可 以 每 列 记录 一 名 学 生 的 各 科 成 绩 ); 

(2) 在 单元 格 内 输入 计算 公式 。 以 每 行 记录 一 名 学 生 的 各 科 成 绩 为 例 , 假 设 第 一 行 依 
次 为 姓名 及 各 考试 科目 名 称 ,最 后 一 名 学 生 第 一 科 的 成 绩 所 在 单元 格 为 B45, 则 可 在 B46 单 
元 格 输入 计算 公式 “二 average(b2:;b45)”, 然 后 回 车 ;或 者 在 适当 的 单元 格 内 插入 函数 (选择 
“插入 ”下 拉 菜 单 ,然后 选择 “函数”, 接 下 来 从 弹出 的 对 话 框 左 边 的 函数 类 别 中 选择 “统计 ”， 
再 从 对 话 框 右边 的 函数 名 中 选择 "Average”, 最 后 单 击 “ 确 定 ”); 

(3) 选 定 第 二 步 计 算 结 果 所 在 单元 格 ,复制 其 他 考试 科目 的 平均 成 绩 。 


4.1.2 众 数 (Mode) 


E 众 数 的 含义 


某 制 鞋 三 要 了 解 消 费 者 最 需要 哪 种 型 号 的 男 皮 鞋 , 调 查 了 某 百 货 商 
场 某 季度 男 皮鞋 的 销售 情况 ,得 到 的 资料 见 表 4-3。 
表 4-3 某 商场 某 季度 男 皮鞋 销售 情况 


男 皮鞋 号 码 (厘米 ) 销售 量 ( 双 ) 男 皮鞋 号 码 (厘米 ) 销售 量 ( 双 ) 
24.0 12 26.0 320 
24.5 84 26.5 104 
25.0 118 27.0 52 
25.5 541 合计 1 200 


JAR 4-3 可 以 看 到 ,25.5 码 的 鞋 销售 量 最 多 ,如 果 我 们 计算 平均 数 , 则 平均 号 码 为 
25. 65 厘米 ,而 这 个 号 码 显然 是 没有 实际 意义 的 ,而 直接 用 25. 5 厘米 作为 顾客 对 男 皮鞋 所 需 
尺寸 的 集中 趋势 既 便捷 又 符合 实际 。 

统计 上 把 这 种 在 一 组 数据 中 出 现 次 数 最 多 的 变量 值 叫做 众 数 , 用 Mo 表示 。 上 面 的 例 
子 中 , 鞋 号 25. 5 厘米 就 是 众 数 。 


B 众 数 计算 


如 果 数 据 集 已 经 分 组 , 则 只 能 按 一 定 的 方法 来 推算 众 数 的 近似 值 。 计 算 公式 为 
Ai Az 


ETA mta A (4-4) 


M,=L+ 


AP :L— RANEH FBR 
U0 一 一 众 数 所 在 组 上 限 ; 
A 一 一 众 数 所 在 组 次 数 与 其 下 限 的 邻 组 次 数 之 差 ; 


Xd 或 M,=U— 


—o 
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As 一 一 众 数 所 在 组 次 数 与 其 上 限 的 邻 组 次 数 之 差 ; 
d 一 一 众 数 所 在 组 组 距 。 
根据 表 4-2 的 数据 ,计算 50 名 工人 日 加 工 零件 数 的 众 数 。 从 表 4-2 中 的 数据 可 以 看 出 ， 
最 大 的 频数 值 是 14, 即 众 数组 为 120 一 125 这 一 组 ,根据 式 (4-4) 可 计算 众 数 为 
14 一 8 


Mo = 120+ Tas) Fab) X5123( 件 ) 
本 14 一 10 
或 Mo =125— Tag) Faa io) T 


众 数 是 一 种 位 置 平均 数 , 是 总 体 中 出 现 次 数 最 多 的 变量 值 , 因 而 在 实际 工作 中 有 时 有 它 
特殊 的 用 途 。 比 如 ,要 说 明 一 个 企业 中 工人 最 普遍 的 技术 等 级 ,说 明 消费 者 需要 的 内 衣 、 鞋 
袜 、 帽 子 等 最 普遍 的 号 码 , 说 明 农 贸 市 场 上 某 种 农 副 产品 最 普遍 的 成 交 价格 等 ,都 需要 利用 
众 数 。 但 是 必须 注意 ,从 分 布 的 角度 看 , 众 数 是 具有 明显 集中 趋势 点 的 数值 ,一 组 数据 分 布 
的 最 高 峰 点 所 对 应 的 数值 即 为 众 数 。 当 然 , 如 果 数 据 的 分 布 没 有 明显 的 集中 趋势 或 最 高 峰 
点 , 众 数 也 可 能 不 存在 ;如 果 有 两 个 最 高 峰 点 ,也 可 以 有 两 个 众 数 。 只 有 在 总 体 单位 比较 多 ， 
而 且 又 明显 地 集中 于 某 个 变量 值 时 ,计算 众 数 才 有 意义 。 


Ẹ 众 数 特点 


(1) 众 数 是 全 体 单位 标志 值 的 代表 值 , 它 不 受 分 布 数列 的 极 大 或 极 小 值 的 影响 ,从 而 增 
强 了 众 数 对 分 布 数列 的 代表 性 。 

(2) 当 分 组 数列 没有 任何 一 组 的 次 数 占 多 数 , 也 即 分 布 数列 中 没有 明显 的 集中 趋势 ,而 
是 近似 于 均匀 分 布 时 , 则 该 次 数 分 配 数列 无 众 数 。 若 将 无 众 数 的 分 布 数列 重新 分 组 或 各 组 
频数 依 序 合 并 ,又 会 使 分 配 数列 再 现 出 明显 的 集中 趋势 。 

(3) 如 果 与 众 数组 相 比邻 的 上 下 两 组 的 次 数 相 等 , 则 众 数组 的 组 中 值 就 是 众 数值 ;如 果 
与 众 数组 比邻 的 上 一 组 的 次 数 较 多 ,而 下 一 组 的 次 数 较 少 , 则 众 数 在 众 数组 内 会 偏向 该 组 下 
限 ;如 果 与 众 数组 比邻 的 上 一 组 的 次 数 较 少 ,而 下 一 组 的 次 数 较 多 , 则 众 数 在 众 数 组 内 会 偏 
向 该 组 上 限 。 

(4) 缺乏 敏感 性 。 这 是 由 于 众 数 的 计算 只 利用 了 众 数 组 的 数据 信息 ,不 像 数 值 平 均 数 
那样 利用 了 全 部 数据 信息 。 


> 4.1.3 中 位 数 (Median) 


E 中 位 数 的 含义 


中 位 数 是 将 数据 按 大 小 顺序 排列 起 来 ,形成 一 个 数列 ,居于 数列 中 间 位 置 的 那个 数据 就 
是 中 位 数 。 简 单 来 说 ,中 位 数 就 是 描述 一 组 数据 中 间 位 置 的 数 , 用 M. 表示 。 

从 中 位 数 的 定义 可 知 , 所 研究 的 数据 中 有 一 半 小 于 中 位 数 ,一 半 大 于 中 位 数 。 中 位 数 的 
作用 与 平均 数 相近 ,是 数据 中 心 位 置 的 代表 值 。 

在 数列 中 出 现 极 端 变量 值 的 情况 下 ,用 中 位 数 作为 代表 值 要 比 用 平均 数 更 好 ,因为 中 位 
数 不 受 极端 变量 值 的 影响 ;如 果 研 究 目的 就 是 为 了 反映 中 间 水 平 ,当然 也 应 该 用 中 位 数 ; 在 
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统计 数据 的 处 理 和 分 析 时 ,可 结合 使 用 中 位 数 。 


E 中 位 数 的 计算 


确定 中 位 数 ,首先 将 数据 集 按 顺 序 排列 ,这 里 有 两 种 情况 : 
(1) 对 于 未 分 组 的 原始 资料 ,假设 排序 的 结果 为 


Lı Nay Say", 


则 中 位 数 由 下 式 来 确定 
Tris (n 为 奇数 ) 


M.4 x, Ts (4-5) 
Cn 为 偶数 ) 


例如 ,计算 表 4-2 的 数据 50 名 工人 日 加 工 零件 数 的 中 位 数 。 中 位 数 的 位 置 第 25 个 数值 
(123) 和 第 26 个 数值 (123) 之 间 , 即 M.=(123 十 123)/2 王 123( 件 ) 。 

(2) 由 分 组 资料 确定 中 位 数 。 由 组 距 数列 确定 中 位 数 , 应 先 按 SS/ 的 公式 求 出 中 位 数 
所 在 组 的 位 置 , 然 后 再 按 下 限 公 式 或 上 限 公式 确定 中 位 数 。 


i 
FRAR: M, =L+ -s Smag 

i (4-6) 
CT 


式 中 ;M, 一 一 中 位 数 ; 
[一 一 中 位 数 所 在 组 下 限 ; 
U 一 一 中 位 数 所 在 组 上 限 ; 
/一 一 中 位 数 所 在 组 的 次 数 ; 
/一 一 总 次 数 ; 
4 一 一 中 位 数 所 在 组 的 组 距 ; 
S,_ 1 一 一 中 位 数 所 在 组 以 下 的 累计 次 数 ，; 
S41 一 一 中 位 数 所 在 组 以 上 的 累计 次 数 。 
为 说 明 中 位 数 的 计算 ,我 们 以 表 4-2 数据 为 例 , 计 算 50 名 工人 日 加 工 零件 数 的 中 位 数 。 
表 4-4 某 企业 50 名 工人 加 工 零 件 中 位 数 计算 表 


按 零 件数 分 组 (个 ) 频数 (人 ) 向 上 累计 (人 ) 向 下 累计 (人 ) 
105 一 110 3 3 50 
110~115 5 8 47 
115~120 8 16 42 
120~125 14 30 34 
125 一 130 10 40 20 
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续 表 
按 零件 数 分 组 (个 ) 频数 (人 ) 向 上 累计 (人 ) 向 下 累计 (人 ) 
130 一 135 6 46 10 
135 一 140 4 50 4 


由 表 4-4 可 知 , 中 位 数 的 位 置 于 50/2 王 25, 即 中 位 数 在 120~125 这 一 组 ,了 一 120， 
Sm—1 = 16 ,U=125 S41 = 20s 了 ,二 14,d 二 5, 根 据 中 位 数 公式 得 

50—16 2 

M. 一 120 十 二 7 一 X5 一 123. 21( 件 ) 或 M,=125—-——— 


| 3. 中 位 数 特点 


(1) 中 位 数 不 受 分 布 数列 的 极 大 或 极 小 值 影响 ,从 而 在 一 定 程度 上 提高 了 中 位 数 对 分 
布 数列 的 代表 性 。 

C2) 有 些 离散 型 变量 的 单项 式 数列 , 当 次 数 分 布 偏 态 时 ,中 位 数 的 代表 性 会 受到 
影响 。 

(3) 中 位 数 缺乏 敏感 性 。 


> 4.1.4 众 数 .中 位 数 和 算术 平均 数 的 比较 


X5=123. 21( 件 ) 


[i 平均 数 、 众 数 和 中 位 数 的 关系 


从 分 布 的 角度 看 , 众 数 始终 是 一 组 数据 分 布 的 最 高 峰值 ,中 位 数 
是 处 于 一 组 数据 中 间 位 置 上 值 ,而 均值 则 是 全 部 数据 的 算术 平均 。 
因此 ,对 同一 组 数据 计算 众 数 、 中 位 数 和 均值 ,三 者 之 间 具 有 以 下 
RA: 

(1) 如 果 数 据 具有 单一 众 数 , 且 分 布 是 对 称 的 , 众 数 (Ms) .中 位 数 
CM.) 和 均值 (z) 必 定 相 等 , 即 荆 一 Mo 一 M. 。 

(2) 如 果 数 据 是 左 偏 分 布 , 说 明 数 据 存 在 极 小 值 ,必然 拉动 均值 向 极 小 值 一 方 靠 ,而 众 
数 和 中 位 数 由 于 是 位 置 代表 值 ,不 受 极 值 的 影响 ,因此 .三 者 之 间 的 关系 表现 为 :二 
M.<M,. 

(3) 如 果 数 据 是 右 偏 分 布 ,说 明 数 据 存在 极 大 值 . 必 然 拉 动 均值 向 极 大 值 一 方 靠 , 则 M < 
M. <ī. 

上 述 关系 如 图 4-1 所 示 : 


[2 平均 数 、 众 数 和 中 位 数 的 应 用 
(1) 当 数据 呈 对 称 分 布 或 接近 对 称 分 布 时 ,三 个 代表 值 相等 或 接近 相等 ,这 时 应 选择 均 
值 作为 集中 趋势 的 代表 值 , 因 为 均值 包含 了 全 部 数据 的 信息 ,而 且 易 被 大 多 数 人 所 理解 和 


接受 。 


o— 


统计 学 基础 (第 二 版 ) 


- EMMG MMX 
图 4-1 不 同 分 布 的 众 数 、 中 位 数 和 平均 数 
(2) 当 数据 为 偏 态 分 布 ,特别 是 当 偏 斜 的 程度 较 大 时 ,我 们 应 选择 众 数 或 中 位 数 等 位 置 


代表 值 , 这 时 它们 的 代表 性 要 比 均值 好 。 


4.1.5 四 分 位 数 


如 果 将 一 组 数据 划分 为 四 部 分 ,每 一 部 分 大 约 包 含 1/4 或 25% 的 观测 值 ,分 割 点 位 的 数 
称 为 四 分 位 数 。 图 4-2 所 示 显 示 了 一 个 被 分 为 四 部 分 的 数据 集 。 
Q 二 第 一 四 分 位 数 (下 四 分 位 数 ) 或 25% 位 置 的 数 
QQ 二 第 二 四 分 位 数 (中 位 数 ) 或 50% 位 置 的 数 
Q; 二 第 三 四 分 位 数 ( 上 四 分 位 数 ) 或 75% 位 置 的 数 


Mo=Me=X 


Q, 
25% 


3310 3355 3450 


25% 
3480 3480 3490 
ee KERER 第 三 四 分 位 数 
(中 位 数 ) 

图 4-2 四 分 位 数位 置 

与 中 位 数 的 计算 方法 类 似 ,根据 未 分 组 数据 计算 四 分 位 数 时 ,首先 对 数据 进行 排序 , 然 
后 确定 四 分 位 数 的 位 置 ,该 位 置 上 的 数值 就 是 四 分 位 数 ,但 在 确定 四 分 位 数位 置 时 数列 是 奇 
数 还 是 偶数 会 影响 Q 和 Q 的 位 置 的 确定 。 

计算 Q 和 QQ, 将 nn 个 数 从 小 到 大 排列 ,Qs 是 个 数组 成 数列 的 中 位 数 。 

(1) 当 n 为 奇数 时 ,中 位 数 Q 将 该 数列 分 为 数量 相等 的 两 组 数 , 每 组 有 (1 一 1)/2 个 数 。 
Qi 为 第 一 组 数 的 中 位 数 ,Q; 为 第 二 组 数 的 中 位 数 。 

一 组 数据 :6 47 49 15 42 41 7 39 43 40 36; 

排序 后 :6 7 15 36 39 40 41 42 43 47 49; 

中 位 数 Q: Xt Xa+ Xe 40; 

第 一 分 位 数 Q, 是 第 一 组 数 :6 7 15 36 39 Kii% Q =15; 

第 三 分 位 数 Q 是 第 二 组 数 :41 42 43 47 49 的 中 位 数 , 即 Q,=43. 

(2) 当 为 偶数 时 ,中 位 数 Q, 将 该 数列 分 为 数量 相等 的 两 组 数 ,每 组 有 n/2 数 ,Q, 为 第 
一 组 n/2 个 数 的 中 位 数 ,Qs 为 第 二 组 n/2 个 数 的 中 位 数 。 

一 组 数据 :6 47 15 42 41 7 39 43 40 36; 

排序 后 :6 7 15 36 39 40 41 42 43 47; 

中 位 数 Qi 一 (Xs 十 XX(wzt+5)/2 王 (39 十 40)/2 二 39. 5; 


25% 
3520 3540 3550 


25% 
3650 3730 3925 


一 一 6 
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第 一 分 位 数 Q 是 第 一 组 数 :6 7 15 36 39 的 中 位 数 , 即 Q =15; 

第 三 分 位 数 Q 是 第 二 组 数 :40 41 42 43 47 的 中 位 数 , 即 Q 二 42。 

如 果 把 一 组 数据 分 割 为 两 部 分 ,两 部 分 数据 个 数 是 偶数 , 则 计算 四 分 位 数 的 方法 和 中 位 
数 的 计算 方法 类 似 。 

如 图 4-2 所 示 中 : 

Qe = (Xs +X carey )/2= (3 490 十 3 520)/2=3 505; 

第 一 分 位 数 Q, 是 第 一 组 数 :3 310 3355 3450 3480 3480 3490 的 中 位 数 ,Q， 
= (Xam +Xantv)/2=(3 450 十 3 480)/2=3 465; 

第 三 分 位 数 Q, 是 第 二 组 数 :3 520 3540 3550 3650 3730 3 925 的 中 位 数 ,Q， 
= (Xen +Xaney)/2=(3 550 十 3 650)/2=3 600。 


b 4.1.6 四 分 位 数 间 距 


四 分 位 数 间 距 (inter-quartile range,IQR) 作 为 对 变异 程度 的 一 种 度量 ,能 够 克服 极端 值 
的 影响 。 它 是 第 三 四 分 位 数 Qi 与 第 一 四 分 位 数 Q, 的 差 值 。 

对 于 图 4-2 显示 的 数据 ,四 分 位 数 Q:=3 600,Q =3 465, 因 此 ,四 分 位 数 间 距 (IQR) 等 
于 3 600 一 3 465 二 135。 


了 4.1.7 五 数 概括 法 和 箱 形 图 


在 一 组 数据 中 ,使 用 下 面 5 个 数据 来 汇总 数据 的 方法 称 为 五 数 概括 法 。 

(1) 最 小 值 ; 

(2) 第 一 四 分 位 数 (Q, ) ; 

G) 中 位 数 (Q.)， 

(4) 第 三 四 分 位 数 (Q;); 

(5) 最 大 值 。 

五 数 概括 法 是 首先 将 一 组 数据 按 升序 排列 ,然后 确定 最 小 值 、 三 个 四 分 位 数 和 最 大 值 。 
如 图 4-2 所 示 数 据 集 : 

3310 3355 3450|3480 3480 3490|3520 3540 3550|3650 3730 
3 925 

Min Qi: 一 3 465 Q.=3 505 Q,=3 600 Max 

于 是 ,得 到 这 组 数据 的 五 个 概括 值 :3 310.3 465,3 505,3 600,3 925, KAA 1/4 25% 
的 观测 值 在 五 数 概括 法 的 相 邻 两 个 数 之 间 。 

箱 型 图 (box plot) 是 基于 五 数 概括 法 的 一 个 图 形 汇 总 。 绘 制 箱 形 图 的 关键 是 计算 中 位 
数 、 四 分 位 数 , 并 计算 四 分 位 间距 。 图 4-3 是 图 4-2 数据 集 的 箱 型 图 。 绘 制 箱 型 图 的 步 又 
WTF: 

(1) 画 一 个 箱 体 ,其 边界 的 位 置 分 别 对 应 数据 集 的 第 一 和 第 三 四 分 位 数 (Q, M Qs). 
个 箱 体 包含 了 中 间 50% 的 数据 。 

(2) 在 箱 体 上 中 位 数 的 位 置 画 一 条 垂 线 。 
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(3) 利用 四 分 位 间距 , 设 定 界限 位 置 。 分 别 在 箱 形 图 的 界限 处 Q 左 侧 1. 5 个 四 分 位 间 
距 的 位 置 ( 下 限 ) 和 Q 右 侧 1. 5 个 四 分 位 间距 的 位 置 ( 上 限 ) 画 一 条 垂 线 。 对 于 图 4-2 数据 
集 ,Qi=3 465,Q;=3 600,IQR 王 135, 下 限 值 的 位 置 为 Qi 一 1.5IQR 王 3 465 一 1.5X135 
3 262. 5; 上 限 值 的 位 置 为 Q +1. 5IQR=3 600+1.5X135=3 802.5. 

(4) 从 箱 体 两 端 边 向 外 各 画 一 条 虚线 ,虚线 的 边界 位 置 是 箱 体 的 两 边 到 界限 内 的 原始 
数据 的 最 大 值 和 最 小 值 处 。 在 数据 集中 ,界限 内 的 两 个 端点 是 3 310 和 3 730。 

(5) 用 * 表示 标 注 处 于 界限 以 外 位 置 的 数据 ,这 些 值 称 为 异常 值 。 在 图 4-3 中 ,我 们 看 
到 有 一 个 异常 值 3 925。 


Q， 中 位 数 Q, 
下 限 上 限 J" 
= 1.510R —=|-IOR-~|-—— 1.510R —=| * 
L 1 | L 1 1 1 1 1 1 
3.000 3 200 3 400 3 600 3 800 4000 


图 4-3 显示 上 下 限 的 数据 箱 形 图 


图 4-3 演示 了 箱 形 图 绘制 的 具体 步骤 ,在 通常 状况 下 ,一般 不 要 求 具 体位 置 标注 ,只 需 
要 箱 形 图 的 一 般 形状 。 


ted 


1. 一 个 样本 数据 值 为 10、20、21、17、16、12, 计 算 其 平均 值 和 中 位 数 。 

2. 一 组 数据 值 为 53、55、70、58、64、57、53、69、57、68、53 的 一 个 样本 ,计算 平均 值 .中 位 
数 和 众 数 ,描述 其 分 布 特征 。 

3. 在 上 赛季 的 NBA 常规 赛 中 , 球 队 3 分 球 投篮 数 创 历史 新 高 , 场 均 19 个 。 为 使 比赛 
更 具 观 赏 性 , 赛 委 会 试图 阻止 这 么 多 的 3 分 球 投篮 ,并 且 鼓励 在 禁区 里 面 进攻 。 从 新 赛季 开 
始 , 赛 委 会 的 新 规则 是 将 3 分 球 线 从 7. 10 米 向 后 移 到 7. 25 米 。 表 4-5 是 新 赛季 开始 后 18 
场 篮球 赛 3 分 球 投篮 次 数 和 命中 次 数 的 样本 数据 。 

#45 题 3 的 样本 数据 


3 分 球 投篮 次 数 3 分 球 命中 次 数 3 分 球 投篮 次 数 3 分 球 命中 次 数 
23 4 17 7 
20 6 19 10 
17 5 22 7 
18 8 25 11 
13 4 15 6 
16 4 10 5 
8 5 11 3 
19 8 25 8 
28 f 23 7 
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(1) 每 场 比赛 3 分 球 投篮 的 平均 次 数 是 多 少 ? 

(2) 每 场 比赛 3 分 球 命中 的 平均 次 数 是 多 少 ? 

(3) 较 近 的 3 分 线 ,球员 的 命中 率 为 35% ,对 新 的 3 分 线 ,球员 的 命中 率 是 多 少 ? 

(4) 新 赛季 的 规则 将 3 分 线 后 移 至 7. 25 米 后 有 何 影 响 ? 体育 新 闻 的 报道 称 :3 分 线 的 
后 移 并 没有 使 比赛 发 生 显著 的 变化 。 你 是 否认 同 这 一 观点 ? 请 解释 。 

4. 研究 人 员 收集 了 一 组 预测 俄罗斯 2014 年 GDP 的 增长 速度 (%) 数 据 , 见 表 4-6。 


表 4-6 题 4 的 样本 数据 


2.6 3.1 2.3 2.7 3.4 0.9 2.6 2.8 2.0 2.4 
2.7 2.7 2.9 2.7 3.1 2.8 1.7 2.3 2.8 3.5 
0.4 2.5 2.2 1,9 1.8 ia 2.0 2.1 2.5 0.5 


(1) GDP 增长 速度 的 最 小 预测 值 是 多 少 ? 最 大 预测 值 是 多 少 ? 

(2) 计算 平均 数 、 中 位 数 和 众 数 。 

(3) 计算 第 一 四 分 位 数 和 第 三 四 分 位 数 。 

(4) 根据 预测 数据 ,应 对 俄罗斯 经 济 状况 持 乐观 还 是 翡 观 看 法 ? 请 讨论 。 
(5) 绘制 数据 集 的 箱 形 图 。 


[4. 2 “离散 程度 的 测度 | 2 离散 程度 的 测度 


除了 位 置 的 度量 外 ,统计 分 析 还 需要 考虑 数据 分 布 的 变异 程度 亦 即 离散 程度 的 度量 。 
假设 你 是 一 家 制造 企业 的 采购 代理 ,经 常 向 两 个 不 同 的 供应 商 下 订单 。 经 过 几 个 月 的 运营 ， 
你 发 现 A\B 两 个 供应 商 完成 订单 所 需 的 平均 时 间 都 是 10 天 左右 。 二 者 完成 订单 所 需 工作 
日 的 直方 图 如 图 4-4 所 示 。 


0.5 0.5 
0.4 0.4 
St 0.3 St 0.3 
EN 
0.2 0.2 
0.1 0.1 
= = 
9 10 1 7 8 9 10 11 12 13 14 15 
A 公 司 交 货 天 数 B 公 司 交 货 天 数 


4-4 A、B 供应 商 交 货 时 间 直 方 图 


尽管 两 个 供应 商 的 平均 交 货 时 间 都 是 10 天 ,但 他 们 在 按时 交 货 方面 是 否 拥有 相同 的 可 
信和 度 ? 注意 直方 图 中 交 货 时 间 的 变异 程度 或 离散 程度 ,你 会 选择 那 一 家 供应 商 ? 对 于 多 数 
公司 来 说 ,按时 收 到 原材料 和 货物 供给 是 很 重要 的 。 从 B 公司 的 直方 图 来 看 ,7 天 或 8 天 交 
货 可 能 会 赢得 客户 ,但 有 一 部 分 延迟 到 13 一 15 天 的 交 货 期 ,对 于 生产 企业 来 说 是 比较 麻烦 
的 。 这 个 例子 说 明了 这 样 一 种 情形 , 即 交 货 时 间 的 变异 程度 往往 是 选择 供应 商 最 主要 的 考 


OQ 


= 
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E 
应 


因素 。 对 大 多 数 的 采购 代理 来 说 , 像 A 公司 这 样 变异 程度 较 小 的 供应 商 才 是 较 理想 的 供 
商 。 下 面 要 介绍 的 是 一 些 描述 数据 变异 程度 的 度量 。 


PP 4.2.1 Re 


下 
HE 


极 差 (range) 也 称 为 全 距 ,是 一 种 最 简单 的 变异 程度 的 度量 。 其 计算 公式 如 下 : 
极 差 (R) 一 最 大 值 一 最 小 值 

例如 ,两 个 学 习 小 组 的 统计 学 考试 成 绩 分 别 为 : 

第 一 组 :60,70.80,90,100; 

第 二 组 :78,79,80,81,82。 

很 明显 ,两 个 小 组 的 考试 成 绩 平均 分 都 是 80 分 ,但 是 哪 一 组 的 分 数 比较 集中 呢 ? 

如 果 用 全 距 指标 来 衡量 , 则 有 

Rẹ =100—60=40(4}) Rz 二 82 一 78 二 4( 分 ) 

这 说 明 第 一 组 的 成 绩 离 中 趋势 远大 于 第 二 组 数据 。 

在 实际 工作 中 ,全 距 常 用 来 检查 产品 质量 的 稳定 性 和 进行 质量 控制 。 在 正常 生产 条 件 
,全 距 在 一 定 范围 内 波动 ,车 全 距 超 过 给 定 的 范围 ,就 说 明 有 异常 情况 出 现 。 因 此 ,利用 全 
有 助 于 及 时 发 现 问题 ,以 便 采取 措施 ,保证 产品 质量 。 


b 4.2.2 PW 


平均 差 (mean deviation) 是 所 有 观测 值 与 其 平均 数 的 差 的 绝对 值 的 平均 数 。 
“在 数据 未 分 组 的 情况 下 ,平均 差 的 计算 公式 为 
X | xz 一 天 | 

N 


A. D = (4-7) 
仍 以 第 一 组 学 生 数 学 成 绩 为 例 , 计 算 平均 差 如 下 : 
A, p= !60=801 + 170—80| + |80—80] + |90—80| +|100—80| -12( 分 ) 
5 
。 在 资料 已 分 组 的 情况 下 ,要 用 加 权 平 均 差 公式 : 
De læ alg (4-8) 
DF 
通过 计算 表 4-7 某 公 司 支付 的 当月 加 班 费 的 平均 差 , 了 解 其 计算 过 程 。 
R47 加 班 工资 统计 表 
加 班 工资 (元 ) DBP) 组 中 值 Cz) of ae l-al 
250~270 15 260 3 900 —50 750 
270~290 25 280 7 000 —30 750 
290~310 35 300 10 500 =10 350 
310~330 65 320 20 800 10 650 
330~350 40 340 13 600 30 1 200 
总 计 180 55 800 3 700 


—o 
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由 (4-8) 式 可 得 到 


z= 2f _ 55.800 _ 310( 元 ) 
Sif 180 
JS 
A.D 2i le-a lf 3 T00 ~~ 20.6( 元 ) 
DI 180 


由 于 平均 差 采用 了 离 差 的 绝对 值 ,不 便于 运算 ,这 样 使 其 应 用 受到 了 很 大 限制 。 


4.2.3 方差 与 标准 差 


方差 (variance) 和 标准 差 (standard deviation) 是 测度 数据 变异 程度 
的 最 重要 、 最 常用 的 指标 。 方 差 是 各 个 数据 与 其 算术 平均 数 的 离 差 平方 
的 平均 数 , 通 常 以 ao 表示。 方差 的 计量 单位 不 便于 从 经 济 意义 上 进行 解 
释 , 所 以 实际 统计 工作 中 多 用 方差 的 算术 平方 根 一 一 标准 差 来 测度 统计 
数据 的 差异 程度 。 标 准 差 又 称 均 方 差 , 一 般 用 ol 西格玛 ) 表 示 。 方差 和 
标准 差 的 计算 也 分 为 简单 平均 法 和 加 权 平 均 法 ,另外 ,对 于 总 体 数据 和 
样本 数据 ,公式 略 有 不 同 。 


E 总 体 方差 和 标准 差 
设 总 体 方 差 为 o ,对 于 未 经 分 组 整理 的 数据 ,方差 的 计算 公式 为 


i 
Slog — x)? 
= 二 一 一 (4-9) 
对 于 分 组 数据 ,方差 的 计算 公式 为 
K 
dcx, —X)* sf 
o? = 1 (4-10) 
(411) 
分 组 数据 : 
(4-12) 


E 样本 方差 和 标准 差 
样本 方差 与 总 体 方差 在 计算 上 的 区 别 是 :总 体 方差 是 用 数据 个 数 或 总 频数 去 除 离 差 平 


90- 一 一 
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取决 于 原 变量 值 本 身 水 平 高 低 的 影响 ,也 就 是 与 变量 的 均值 大 小 有 关 。 变 量 值 绝 对 水 平 越 
高 ,离散 程度 的 测度 值 自 然 也 就 越 大 ,绝对 水 平 越 低 ,离散 程度 的 测度 值 自 然 也 就 越 小 ; 另 一 
方面 它们 与 原 变量 值 的 计量 单位 相同 ,采用 不 同 计量 单位 计量 的 变量 值 , 其 离散 程度 的 测度 
值 也 就 不 同 。 因 此 ,对 于 平均 水 平 不 同 或 计量 单位 不 同 的 不 同 组 别 的 变量 值 , 是 不 能 直接 用 
上 述 离散 程度 的 测度 值 直接 进行 比较 的 。 为 了 消除 变量 值 水 平 高 低 和 计量 单位 不 同 对 离散 
程度 测度 值 的 影响 ,需要 计算 离散 系数 (coefficient of variation) 。 

离散 系数 通常 是 用 标准 差 来 计算 的 ,因此 ,也 称 为 标准 差 系数 , 它 是 一 组 数据 的 标准 差 
与 其 相应 的 均值 之 比 ,是 测度 数据 离散 程度 的 相对 指标 ,其 计算 公式 为 : 


pt =S 
Vimy 或 V, = 


V, 和 V, 分 别 表示 总 体 离散 系数 和 样本 离散 系数 。 

离散 系数 要 是 用 于 对 不 同 组 别 数据 的 离散 程度 进行 比较 ,离散 系数 
大 的 说 明 该 组 数据 的 离散 程度 也 就 大 ,离散 系数 小 的 说 明 该 组 数据 的 离 
散 程度 也 就 小 。 

表 4-8 是 Glaser 集团 下 属 8 家 公司 产品 销售 数据 ,管理 层 想 知道 公 
司 利润 水 平和 产品 销售 额 之 间 哪 一 个 指标 更 有 代表 性 。 


(4-17) 


R48 集团 公司 8 家 子 公 司 的 产品 销售 数据 单位 :万 元 
公司 编号 产品 销售 额 销售 利润 公司 编号 产品 销售 额 销售 利润 
1 170 8.1 5 480 26.5 
2 220 12.5 6 650 40. 0 
3 390 18. 0 7 950 64.0 
4 430 22. 0 8 1000 69. 0 


由 于 销售 额 与 利润 额 的 数据 水 平 不 同 ,不 能 直接 用 标准 差 进 行 比较 ,需要 计算 离散 系 
数 。 由 表 中 数据 计算 得 
309.19_ 


X, =536. 25( 万 元 ) ”Si 二 309. 19( 万 元 ) Va Gages OS 
BK, =32.521 5( 万 元 ) Ss 一 23.09( 万 元 ) Vs 一 -2309 =o. 710 
z 2 ” 32:5125 


计算 结果 表明 ,Vi 过 Vs ,说 明 产品 销售 额 的 离散 程度 小 于 销售 利润 的 离散 程度 。 


4.3 AMES 


b 4.3.1 偏 态 及 其 测度 


偏 态 是 对 数据 分 布 偏 斜 方向 及 程度 的 测度 。 从 上 节 的 讨论 中 我 们 知道 ,利用 众 数 .中 位 


o— 
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数 和 均值 之 间 的 关系 就 可 以 判断 分 布 是 左 偏 还 是 右 偏 。 显 然 , 判 断 偏 态 的 方向 并 不 困难 ,但 
要 测度 偏 斜 的 程度 就 需要 计算 偏 度 的 大 小 了 。 

图 4-5 是 根据 某 公 司 销售 数据 绘制 的 频数 分 布 的 直方 图 。 其 中 图 4-5 Ca) 和 图 4-5(b) 
的 直方 图 呈现 出 一 定 程度 的 偏 态 :图 4-5(a) 的 直方 图 是 左 偏 的 , 它 的 偏 度 是 一 0. 85; 图 4-5 
(b) 的 直方 图 是 右 偏 的 , 它 的 偏 度 是 十 0. 85; 图 4-5(c) 的 直方 图 是 对 称 的 , 它 的 偏 度 是 0。 
用 来 计算 偏 度 的 公式 有 些 复杂 ,我 们 只 给 出 结果 ,但 使 用 统计 软件 很 容易 计算 出 偏 度 。 对 
于 左 偏 的 数据 , 偏 度 是 负数 ;对 于 右 偏 的 数据 , 偏 度 是 正 数 ;如 果 数 据 是 对 称 的 , 则 偏 度 
为 0。 


0.35T 0.35f 0.35 
0.307 0.30 0.30 7 
0.257 0.25 F 0.257 
0.20 F 0.20 0.20 F 
0.15 F 0.15 0.15f 
0.10 0.10 0.10 | 
0.05 0.05 0.05 
0 0 0 
(a) 左 偏偏 度 -_0.85 (b) 右 偏 _ 偏 度 -0.85 (c) 对 称 “ 偏 度 -0 
图 4-5 三 种 不 同 偏 态 的 直方 图 
偏 度 通 常 采用 下 面 的 公式 : 
7 n xrı— Iy 
偏 度 CSK ) = | : ) (4-18) 


> 4.3.2 峰 态 及 其 测度 


峰 度 是 分 布 集中 趋势 高 峰 的 形态 。 它 通常 是 与 对 称 分 布 相 比较 来 
说 的 ,在 归 化 到 同一 方差 时 , 若 分 布 的 形状 比 对 称 分 布 更 瘦 更 高 , 则 称 为 
尖峰 ,车 比 正 态 分 布 更 矮 更 胖 , 则 称 为 平 峰 分 布 。 如 图 4-6 所 示 。 


(a) 尖峰 分 布 (b) 扁平 分 布 
图 4-6 两 种 不 同 峰 态 的 分 布 曲线 图 


峰 度 用 下 列 公式 计算 : 


niant D (zi 一 二 4 一 3[ >) a — 2° PF — 1) 
(n—1)(n—2)(n—3)s* 


WRECK) = (4-19) 
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44 相对 位 置 的 度量 和 异常 值 的 检测 


> 4.4.1 z 一 分 数 


对 一 个 数据 集 , 除 了 位 置 、 变 异 程度 和 分 布 形态 的 测度 外 ,还 有 数据 集中 数据 的 相对 位 
置 测度 能 够 帮助 我 们 确定 一 个 特定 值 的 数值 距 平均 数 有 多 远 。 

利用 平均 数 和 标准 差 , 可 以 确定 任何 观测 值 的 相对 位 置 。 假 设 有 个 观测 值 xl ,zs ,…， 
Zz 的 样本 ,其 样本 平均 值 和 样本 标准 差 ;已 经 被 计算 出 来 。 任 何 一 个 数值 x; 与 其 平均 值 
的 离 差 与 标准 差 的 比值 称 为 = 一 分 数 。 
=a E (4-20) 


xz 一 分 数 也 被 称 为 标准 分 数 或 标准 化 值 。z; 可 以 解释 为 观测 值 x; FS E AE S 
是 zx; 个 标准 差 。 

比如 一 组 数据 为 25、28、31、34、37、40、43, 其 平均 值 为 34, 标 准 差 为 6。 其 变换 可 用 
图 4-7 表 示 。 


x, x, x, x, X; Xe x, 

原 数据 集 数 轴 L L 1 L 1 1 1 

25 28 31 34 37 40 43 

减 去 均值 后 数 轴 一 -9 ~6 2 站 3 73 9 
RAEN ig -1.0 D5 0 0.5 1.5 1.5 


z z 


图 4-7 xz 一 分 数 变换 图 

例如 ,六 三 一 1.5, 表 示 zi 比 样本 均值 小 1. 5 个 标准 差 。 类 似 的 2p = 1.5, RIR zz 比 样 
本 均值 大 1. 5 个 标准 差 。 当 观测 值 大 于 平均 数 时 ,< 一 分 数 将 大 于 零 ; 当 观测 值 小 于 平均 数 
时 ,x 一 分 数 将 小 于 零 。 

(1) 经 验 法 则 。 

对 于 具有 对 称 分 布 ( 钟 形 分 布 ) 的 数据 : 

DO 大约 68% 的 数据 值 与 平均 数 的 距离 在 1 个 标准 差 之 内 。 

© KH 95% 的 数据 值 与 平均 数 的 距离 在 2 个 标准 差 之 内 。 

© 几乎 所 有 数据 值 与 平均 数 的 距离 在 3 个 标准 差 之 内 。 

(2) 切 比 雪夫 定理 。 

经 验 法 则 适合 于 对 称 分 布 的 数据 ,如 果 一 组 数据 不 是 对 称 分 布 , 那 么 ,经 验 法 则 就 不 再 
适用 ,这 时 候 , 使 用 切 比 雪夫 定理 能 使 我 们 指出 与 平均 数 的 距离 在 某 个 特定 个 数 的 标准 差 之 
内 数据 值 所 占 的 比例 至 少 为 (1 一 1/>?) ,其 x 中 是 大 于 1 的 任意 实数 。 当 < 二 2,3,4 个 标准 
差 时 ,该 定理 的 一 些 含义 如 下 : 

O 至 少 有 75% 的 数据 值 与 平均 数 的 距离 在 x 二 2 个 标准 差 之 内 。 

© 至 少 有 89% 的 数据 值 与 平均 数 的 距离 在 = 一 3 个 标准 差 之 内 。 

© 至 少 有 94% 的 数据 值 与 平均 数 的 距离 在 = 一 4 个 标准 差 之 内 。 
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例如 , 某 班 100 名 学 生 的 统计 学 课程 期 末 考 试 平均 成 绩 是 70 分 ,标准 差 是 5 分 。 我 们 
感 兴趣 的 问题 是 有 多 少 学 生 的 考试 成 绩 在 60 一 80 分 ”有 多 少 学 生 的 考试 成 绩 在 58 一 82 分 ? 

对 于 60 一 80 分 的 考试 成 绩 , 我 们 注意 到 ,60 分 比 平均 成 绩 低 了 2 个 标准 差 ,而 80 分 比 
平均 成 绩 高 了 2 个 标准 差 。 根 据 切 比 雪夫 定理 ,至 少 有 75% 的 观测 值 与 平均 数 的 距离 在 
z 二 2 个 标准 差 之 内 。 因 此 ,至 少 有 75% 的 学 生成 绩 在 60~80 分 。 

对 于 58 一 82 分 的 考试 成 绩 , 由 (58 一 70)/5 二 一 2.4 可 知 ,58 分 比 平均 值 低 2. 4 个 标准 
差 ; 同 理 ,82 分 比 平均 值 高 2. 4 个 标准 差 。 应 用 切 比 雪夫 定理 , 且 z=2.4, 可 得 到 


1 1 
(1-3)= (1-se)=0. 826 
即 至 少 有 82. 6% 的 学 生 考试 成 绩 在 58 一 82 分 。 
WRON % 


Excel 中 数据 的 描述 统计 示例 


Excel 中 用 于 计算 描述 统计 量 的 方法 有 两 种 ,函数 方法 和 描述 统计 工具 的 方法 。 

一 、 用 函数 计算 描述 统计 量 

常用 的 描述 统计 量 有 众 数 、 中 位 数 、 平 均 数 , 极 差 、 四 分 位 差 .标准 差 方 差 、 标 准 差 系数 
等 。 一 般 来 说 ,在 Excel 中 求 这 些 统计 量 , 示 分 组 资料 可 用 函数 计算 ,已 分 组 资料 可 用 公式 
计算 。 这 里 我 们 介绍 如 何 用 函数 来 计算 未 分 组 资料 的 描述 统计 量 。 

用 函数 运算 有 两 种 方法 :一 是 手工 输入 函数 名 称 及 参数 。 这 种 输入 形式 比较 简单 、 快 
捷 。 但 需要 非常 熟悉 函数 名 称 及 其 参数 的 输入 形式 。 所 以 .只 有 比较 简单 的 函数 才 用 这 种 
方法 输入 ;二 是 函数 导入 法 。 这 是 一 种 最 为 常用 的 办 法 , 它 适合 于 所 有 函数 的 使 用 ,而 且 在 
导入 过 程 中 有 向 导 提示 ,因而 非常 方便 。 

下 面 示例 是 统计 中 常用 统计 量 的 函数 统计 方法 。 

1. 众 数 

图 4-8 是 研究 人 员 随 机 抽取 的 某 公 司 30 名 临时 雇员 的 薪酬 数据 ,已 录入 Excel 表 。 
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4-8 30 名 临时 雇员 的 薪酬 数据 


项 目 4 数据 的 概括 性 测度 [ 


(1) 手 工 输入 函数 名 称 及 参数 。 单 击 任 一 单元 格 ,输入 二 MODE(A1:F5), 回 车 后 即 可 
得 众 数 为 1 560。 如 图 4-9 所 示 。 


a 
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图 4-9 手工 求 众 数 
(2) 函 数 导 和 法。 选择 “插入 ”1 函数 ?选项 ,此 时 出 现 一 个 “插入 函数 ?对话 框 , 在 对 话 框 
的 “选择 类 别 ” 中 确定 函数 的 类 别 * 统 计 ”, 在 “选择 函数 ”内 确定 函数 名 称 MODE, , 单 击 “确定 ” 
后 即 出 现 该 函数 运算 的 对 话 框 向 导 , 在 Number] 选择 数据 区 域 A1: F5, 单 击 “ 确 定 ”, 如 
图 4-10 所 示 , 在 Excel 中 即 得 到 众 数 1 560。 


= {1580, 1340, 1600, 1410, 1590, 1410. .. 
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图 4-10 用 函数 导入 法 求 众 数 


运用 函数 导入 法 ,只 要 知道 每 个 函数 的 含义 , 即 可 按 上 述 程序 得 到 相应 的 运算 结果 ,为 
节约 篇 幅 这 里 不 再 一 一 讲解 ,下 面 仅 列 示 各 函数 的 含义 及 本 例 中 的 运行 结果 。 


其 他 统计 量 的 计算 方法 与 其 类 似 。 

2. 中 位 数 

单 击 任 一 空白 单元 格 , 输 入 “= 二 MEDIAN(A1l:F5)”, 回 车 后 得 中 位 数 为 1 550。 
3. 算术 平均 数 


单 击 任 一 空白 单元 格 ,输入 “二 AVERAGE (A1: F5)”, 回 车 后 得 算术 平均 数 
为 1 531. 666 667。 

4. 几何 平均 数 

单 击 任 一 空白 单元 格 ,输入 “二 GEOMEAN(Al:F5)”, 回 车 后 得 几何 平均 数 为 1 526. 3。 
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5. 调和 平均 数 

单 击 任 一 空白 单元 格 ,输入 * 王 HARMEAN(CA1:F5)”, 回 车 后 得 调和 平均 数 为 1 521. 06. 
6. 全 距 

单 击 任 一 空白 单元 格 ,输入 “二 MAX(A1:F5)-MIN(Al:F5)”, 回 车 后 得 全 距 为 730。 

7. 标准 差 

单 击 任 一 空白 单元 格 , 输 入 “二 STDEV(A1l:F5)”, 回 车 后 得 标准 差 为 132. 537 1 。 

8. 标准 差 系数 

单 击 任 一 空白 单元 格 ,输入 “= 二 STDEV(Al:F5)/AVERAGE(Al:F5)”, 回 车 后 得 标准 


差 系 数 为 0. 086 531。 


9. 偏 度 

单 击 任 一 空白 单元 格 , 输 入 “= 二 SKEW(Al:F5)”, 回 车 后 得 偏 度 系数 为 0. 914 565。 

10. 峰 度 

单 击 任 一 空白 单元 格 ,输入 * 王 KURT(CA1:F5)”, 回 车 后 得 峰 度 系数 为 3. 808 279. 

二 “描述 统计 ”菜单 项 的 使 用 

仍 使 用 上 面 的 例子 ,我 们 已 经 把 数据 输入 到 A1:A30 单元 格 ,然后 按 以 下 步骤 操作 
(1) 在 工具 菜单 中 选择 “数据 分 析 ” 选 项 ,从 其 对 话 框 中 选择 描述 统计 , 单 击 “ 确 定 ”。 如 


图 4-11 所 示 。 
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图 4-11 “描述 统计 "菜单 项 的 使 用 
(2) 在 输入 区 域 中 选择 数据 区 域 $A $1: $A$30, 在 输出 区 域 中 选择 $C$13, 其 他 


复 选 框 可 根据 需要 选 定 , 选 择 汇总 统计 ,可 给 出 一 系列 描述 统计 量 ;选择 平均 数 置信 和 度 ,会 给 
出 用 样本 平均 数 估计 总 体 平均 数 的 置信 区 间 ; 第 KK 大 值 和 第 K 小 值 会 给 出 样本 中 第 K 个 
大 值 和 第 K 个 小 值 。 


(3) 单 击 “ 确 定 ”, 可 得 输出 结果 ,如 图 4-12 所 示 。 
上 面 的 结果 中 ,平均 指 样本 均值 ;标准 误差 指 样本 平均 数 的 标准 差 ; 标 准 差 指 自由 度 为 


n-1 样本 标准 差 ;区 域 描述 的 是 样本 的 极 差 或 全 距 。 可 以 看 出 与 我 们 前 面 用 函数 计算 的 结果 
完全 相同 。 


wD 


1. 观测 值 10、20、12、17 和 16 组 成 的 一 个 样本 ,计算 这 5 个 观测 值 的 极 差 ,方差 和 标准 


2 z— TR, 
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ma em commer) | OE ee |2 i | eave 
= Ssns ET PRET at 
cs 下 | 型 a 
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L 1560 
2 1610 
3 1280 žir 
t 1569 
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日 1340 HERE 24. 19786] 
Y 1570 位 数 1550| 
8 1580 1580} 
1350 mes 。 132. 5371 
1570 方差 17566. 09| 
1600 Be 3. 808279] 
2 1710 az 0, 914555} 
13 1470 区 域 730| 
1t 1560 最 小 值 1250| 
15 1980 AE 1930) 
6 1410 求 和 45950| 
2 1550, Bg 
图 4-12 输出 结果 


2. 一 组 数据 的 均值 为 30, 标 准 差 为 5, 利用 切 比 雪夫 定理 确定 下 列 范围 内 的 数据 所 占 的 比例 。 
20 一 40 15~45 22~38 18 一 42 12~48 
3. 一 项 调查 结果 显示 ,成 年 人 明天 的 平均 睡眠 时 间 为 6.9 小 时 ,假设 其 标准 差 为 1. 2 小 时 。 
(1) 利用 切 比 雪夫 定理 计算 每 天 睡眠 时 间 在 4. 5 一 9. 3 小 时 的 成 年 人 比例 。 
(2) 利用 切 比 雪夫 定理 计算 每 天 睡眠 时 间 在 3. 9 一 9. 9 小 时 的 成 年 人 比例 。 
(3) 假设 睡眠 时 间 服 从 对 称 分 布 , 利 用 经 验 法 则 计算 每 天 睡眠 时 间 在 4.5 一 9. 3 小 时 的 
成 年 人 比例 ,将 这 个 计算 结果 和 (1) 的 结果 进行 比较 。 


ku 


友邦 保险 的 奖惩 政策 


在 友邦 保险 公司 的 董事 会 上 ,董事 们 就 公司 的 发 展 战略 问题 展开 了 激烈 讨论 。 有 的 董 
事 提出 ,2012 年 公司 的 财产 险 销售 收入 为 72 115 万 元 ,与 上 年 相 比 没有 太 大 增长 ,其 中 家 庭 
财产 险 销售 收入 为 3 605 万 元 , 仅 占 财产 险 销 售 收入 的 5%。 其 主观 原因 是 对 家 庭 财产 保险 
的 业务 开展 得 不 够 ,公司 在 管理 方式 上 也 存在 问题 。 大 家 认为 ,国内 的 家 庭 财产 保险 市 场 潜 
力 巨 大 ,应 加 大 扩展 这 一 业务 的 力度 ,同时 ,应 对 公司 家 庭 财 产 险 推 销 员 实行 目标 管理 ,并 根 
据 目 标 完成 情况 建立 相应 的 奖惩 制度 。 管 理 层 也 认为 建议 有 一 定 道理 ,准备 采纳 。 会 后 , 责 
成 相关 部 门 尽快 拿 出 具体 的 实施 方案 。 

部 门 经 理 接 到 任务 后 感到 有 些 头痛 。 如 果 目 标定 得 过 高 ,多数 推 销 员 完 不 成 任务 ,会 使 
推销 员 失 去 信心 ;如 果 定 得 过 低 ,将 不 利于 充分 挖掘 员工 的 工作 潜力 ,提高 公司 的 业绩 水 平 。 
为 了 更 科学 做 出 方案 ,部 门 经 理 收集 了 公司 160 名 保险 营销 人 员 的 月 销售 额 数据 ,样本 数据 
见 表 4-9, 


表 4-9 友邦 保险 营销 人 员 月 销售 额 样本 数据 单位 : 千 元 
25.05 | 17.48 | 13.80 | 25.29 | 15.42 | 16.22 | 21.09 | 17.93 | 26.51 | 22.28 


8.81 22. 38 23. 40 17. 93 18. 64 15. 56 13. 22 21.72 17. 52 17.75 
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续 表 
24. 26 17. 57 21. 66 25. 53 23.94 17.07 21.19 17.97 18. 69 22.65 
9. 64 17.57 18. 73 125.37 15. 48 17.14 17: 16 18. 02 15. 43 15. 88 
11.05 15. 64 26.74 25. 83 16. 98 21:25 21.31 32. 40 1S7 13. 85 
19. 05 15.65 14. 52 26. 07 18. 78 17.31 8.40 18. 24 13.61 23. 27 
25. 64 17.61 21.81 14. 26 17.79 15.13 15. 88 14. 87 18. 96 15. 84 
19. 27 15.46 14.78 26.7 15. 76 18. 22 18. 29 17. 39 14. 16 21.92 
12. 96 15.77 18. 28 17. 84 17. 61 17.25; 21. 64 13.51 19.25 23. 50 
21.16 17.70 14. 92 26. 93 15. 82 21.59 13. 97 18. 33 11. 43 15.15 
17.25 2516 15. 08 17. 66 21, 53 17. 34 15. 34 23.45 19. 35 23.76 
13.33 17.75 21.42 27. 76 15. 86 19. 46 14. 61 18. 42 31. 34 17. 62 
17.25 171 13.25 31. 16 17.16 17.41 21. 88 18.51 17.43 24, 20 
13.61 27.50 15. 27 19. 45 22. 84 23. 65 17. 96 17. 48 19.55 12.74 
21.4 17.90 18. 94 21. 34 15.99 17. 43 18:55 18. 63 19. 91 24. 80 
13. 68 25.40 15. 37 32:55 16.16 22. 13 22. 16 18. 64 21.03 9. 24 
要 求 ， 


(1) 使 用 本 章 介绍 的 数据 分 布 特征 的 测度 方法 来 汇总 数据 。 


(2) 使 用 图 表 分 析 的 方法 展示 你 的 结果 。 
(3) 结合 案例 描述 的 问题 ,提交 你 的 报告 。 这 个 报告 中 应 该 包括 各 种 情况 的 具体 分 析 


结果 及 描述 。 


dp 


本 项 目 主要 介绍 了 数据 分 布 特征 的 测度 方法 。 当 数值 来 自 于 样本 时 ,它们 被 称 为 样本 
统计 量 ; 当 数据 来 自 总 体 时 ,它们 被 称 为 总 体 参 数 。 在 推断 统计 中 ,样本 统计 量 被 称 为 总 体 


参数 的 点 估计 。 下 面 是 一 些 用 来 描述 样本 统计 量 和 总 体 参 数 的 符号 。 


样本 统计 量 


总 体 参数 


平均 数 


æ 


方差 


$ 


标准 差 


i 


数据 位 置 的 测度 ,我 们 定义 了 平均 数 、 中 位 数 和 众 数 ,比较 了 三 者 之 间 的 关系 。 作 为 变 
异 程度 和 离散 程度 的 测度 ,介绍 了 极 差 .四 分 位 数 \ 方 差 .标准 差 和 标准 系数 。 数 据 分 布 形态 
的 度量 主要 是 偏 度 和 峰 度 。 偏 度 为 负 值 时 表示 数据 分 布 左 偏 ; 偏 度 为 正 值 时 表示 数据 分 布 
右 偏 。 还 介绍 了 如 何 利用 五 数 概括 法 和 绘制 箱 形 图 的 方法 ,它们 对 数据 分 布 位 置 、 变 异 程度 


和 形态 提供 了 类 似 的 信息 。 


经 验 法 则 和 切 比 雪夫 定理 是 测度 数据 分 布 特征 时 常用 的 方法 ,通过 使 用 平均 数 和 标准 


一 一 0 


项 目 4 ”数据 的 概括 性 测度 


差 , 可 以 让 我 们 了 解 更 多 的 数据 分 布 信息 ,以 及 识别 出 异常 值 。 
本 项 目 还 演示 了 如 何 使 用 Excel 来 计算 本 章 介 绍 的 描述 统计 量 的 方法 。 
下 面 的 图 总 结 了 数据 分 布 特征 和 适用 的 描述 性 统计 量 。 


项 目 5 


_ ”统计 分 布 


项 目 5 fitt 


>> > | 实践 中 的 统计 
汇丰 银行 的 自动 服务 系统 


汇丰 银行 是 一 家 提供 全 方位 金融 服务 ,包括 支票 储蓄 账户 、 货 款 、 保 险 及 投资 的 全 球 性 
金融 机 构 。 其 高 效 的 自动 服务 系统 为 它 赢得 了 良好 口碑 。 

汇丰 银行 是 首 家 引进 自动 提 款 机 (ATMD) 的 金融 机 构 。 使 用 汇丰 银行 信用 卡 的 客户 在 
任意 一 个 部 署 了 ATM 机 的 地 方 只 需 几 秒 钟 就 可 以 完成 他 们 的 银行 业务 。 每 天 24 小 时 ,每 
周 7 天 ,从 存款 到 投资 管理 超过 150 种 不 同 的 银行 业务 都 可 以 轻松 完成 。 目 前 ,客户 80% 的 
交易 是 通过 ATM 完成 的 。 

汇丰 银行 信用 卡 中 心 向 随机 到 达 的 客户 提供 服务 。 这 是 一 个 排队 等 待 系统 ,如 果 遇 到 
所 有 的 ATM 都 忙 的 话 ,那么 新 来 的 客户 只 能 排队 等 候 。 为 了 更 好 地 提供 服务 ,客户 中 心 的 
研究 人 员 定 期 的 收集 和 分 析 客 户 等 待 时 间 ,以 决定 是 否 需要 增加 新 的 ATM, 

研究 人 员 收 集 的 数据 表明 ,随机 到 达 的 客户 人 数 服从 著名 的 概率 分 布 一 一 泊 松 分 
布 。 根 据 这 个 分 布 规律 ,汇丰 银行 可 以 计算 任意 时 段 能 到 达 ATM 办 理 业 务 的 客户 人 
数 的 概率 ,从 而 决定 所 需 的 ATM 的 数目 。 例 如 , 令 义 表示 1 分钟 内 到 达 的 客户 人 数 。 
假定 到 达 某 一 ATM 的 客户 人 数 平均 每 分 钟 2 人 ,在 1 分钟 内 到 达 的 客户 人 数 的 概率 
见 表 5-1, 


表 5-1 客户 人 数 的 概率 


X 概率 X 概率 

0 0. 135 335 5 0. 036 089 
0. 270 671 6 0. 012 03 
2 0. 270 671 7 0. 003 437 
3 0. 180 447 8 0. 000 859 
4 0. 090 224 >9 0. 000 191 


利用 数据 的 统计 分 布 规律 ,可 以 帮助 我 们 获得 更 多 的 数据 分 布 信 息 。 

如 果 获 得 的 数据 是 所 研究 问题 总 体 的 全 部 数据 ,通过 对 数据 的 描述 
就 可 以 直接 得 到 表示 总 体 数量 规律 性 的 参数 及 其 分 布 特征 ,这 也 是 我 们 
所 希望 的 。 然 而 ,在 实际 研究 中 ,由 于 种 种 原因 ,往往 无 法 得 到 全 部 总 体 
数据 ,只 能 是 搜集 到 一 部 分 的 总 体 数 据 作为 样本 .由 样本 所 提供 的 信息 
对 总 体 数 量规 律 性 做 出 推断 ,其 理论 基础 正如 该 案例 所 使 用 的 方法 一 一 
概率 论 与 统计 分 布 。 


[5. 1 随机 变量 | 随机 变量 


现实 生活 中 大 量 存在 着 不 确定 性 的 事件 ,这 些 事件 的 结果 事先 不 能 确定 。 如 天 气 
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的 晴 与 雨 ,一 只 显像管 能 否 通 过 质量 测试 等 。 这 些 不 确定 性 事件 在 统计 学 上 称 为 随机 
事件 。 随 机 事件 可 能 有 不 同 的 结果 。 各 种 结果 发 生 的 可 能 性 可 能 相同 ,也 可 能 不 同 。 
在 统计 学 中 ,我 们 用 “概率 ”这 个 概念 来 度量 随机 事件 的 某 一 结果 发 生 的 可 能 性 的 大 小 。 
随机 事件 中 某 一 结果 发 生 的 次 数 , 占 全 部 各 种 结果 发 生 的 次 数 的 比率 即 为 该 结果 发 生 
的 概率 。 

随机 变量 (random variable) 是 对 一 个 事件 结果 的 数值 描述 。 随 机 变量 在 不 同 的 条 件 下 
由 于 偶然 因素 影响 ,其 可 能 取 各 种 不 同 的 值 ,具有 不 确定 性 和 随机 性 ,但 这 些 取 值 落 在 某 个 
范围 的 概率 是 一 定 的 。 随 机 变量 的 取 值 可 以 是 离散 型 的 ,也 可 以 是 连续 型 的 。 


5.2 离散 型 随机 变量 | 2 离散 型 随机 变量 


可 以 取 有 限 多 个 或 无 限 可 数 多 个 数值 的 随机 变量 称 为 离散 型 随机 
变量 (discrete random variable) 。 表 5-2 给 出 了 一 些 离散 型 随机 变量 的 
一 些 例 子 。 我 们 注意 到 每 一 个 例子 中 ,离散 型 随机 变量 有 有 限 多 个 取 值 


i 


或 无 限 多 个 可 列举 的 取 值 。 
表 5-2 离散 型 随机 变量 的 示例 
事件 随机 变量 (x) 随机 变量 可 能 的 取 值 
抽查 100 个 产品 取 到 次 品 的 个 数 0.1,2,3,…,100 
一 家 餐馆 营业 一 天 顾客 数 0,1,2,3, 
电脑 公司 一 个 月 的 销售 销售 量 Ooo 
销售 一 辆 汽车 顾客 性 别 男性 为 0, 女 性 为 1 


对 于 离散 型 随机 变量 x, 其 分 布 通过 概率 函数 来 描述 , 记 作 f(z)。 概 率 函 数 给 出 了 随机 
变量 每 一 个 取 值 的 概率 。 
例如 :大 众 公司 销售 各 类 型 乘 用 车 ,销售 记录 显示 ,在 过 去 的 300 天 的 营业 时 间 里 ,其 销 


售 数据 见 表 5-3。 
表 5-3 大 众 公司 300 天 汽车 销售 数据 
销售 数量 (zx) 天 数 销售 数量 (xz) 天 数 
0 54 3 42 
117 4 12 
2 72 5 3 


假设 定义 大 众 销售 的 汽车 销售 数量 是 一 个 随机 变量 xz, 那么 它 可 取 的 值 是 0,1,2,3,4 
或 5。 用 概率 函数 符号 ORRA E 0 辆 汽车 的 概率 ,f(1) 表 示 销 售 1 辆 汽车 的 概率 ,以 此 
类 推 。 根据 历史 数据 ,300 天 中 有 54 天 销售 了 0 辆 汽车 .我 们 指定 F(0) 王 54/300 王 0. 18, 表 
示 一 天 中 没有 卖 出 汽车 的 概率 为 0.18。 同 样 ,我 们 可 以 计算 出 销售 了 1 辆 .2 辆 ,3 辆 .4 辆 
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或 5 辆 汽车 的 概率 ,分 别 用 f(1)、f(2)、f(3)、f(4)、f(5) 表 示 。 表 5-4 是 大 众 公 司 一 天 的 汽 
车 销售 概率 分 布 。 


表 5-4 大 众 公司 一 天 的 汽车 销售 量 的 概率 分 布 


销售 数量 (z) f(x) 销售 数量 (zx) f(x) 
0 0. 18 4 0. 04 
0. 39 5 0.01 
Z 0. 24 合计 1.00 
3 0. 14 


依据 这 个 概率 分 布 ,管理 者 很 容易 获得 数据 分 布 的 信息 。 比 如 ,由 f(1) 二 0. 39 可 知 , 约 
有 39% 的 可 能 性 一 天 卖 出 一 辆 汽车 。 另 外 ,一 天 卖 出 汽车 超过 3 辆 的 概率 是 
f+) + fG)=0. 14 十 0. 04 十 0. 01=0. 19 
图 5-1 是 大 众 公 司 一 天 销售 量 的 概率 分 布 图 。 
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销售 量 (x) 
图 5-1 大 众 公 司 一 天 汽车 销售 量 的 概率 分 布 图 


K 5-4 表明 ,随机 变量 的 概率 函数 具有 下 列 性 质 : 

(D f(x) >0;(2) > fasl. 

大 量 的 离散 型 随机 变量 的 概率 分 布 通常 以 代数 表达 式 的 形式 给 出 。 其 中 三 个 最 重要 的 
分 布 是 :二 项 分 布 泊 松 分 布 和 超 几 何 分 布 ,本 项 目 不 再 讨论 。 


[5. 3 “连续 型 随机 变量 | 3 ”连续 型 随机 变量 


可 以 在 某 一 区 间或 多 个 区 间 内 任意 取 值 的 随机 变量 称 为 连续 型 随机 变量 (continuous 
random variable) 。 度 量 时 间 重量、 距离 ,温度 时 ,其 实验 结果 可 以 用 连续 性 随机 变量 来 描 
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述 。 表 5-5 列举 了 一 些 连续 型 随机 变量 的 例子 ,注意 的 是 每 一 个 例子 中 随机 变量 假定 可 以 


取 某 个 区 间 中 的 任意 值 。 
表 5-5 连续 型 随机 变量 的 例子 
试验 随机 变量 (zx) 随机 变量 可 能 的 取 值 
银行 办 理 业务 两 客户 到 达 的 时 间 间 隔 z>0 
MEHER it CK 5 毫升 ) 液体 容量 数 0o 委 zs5 
图 书馆 工程 工程 完成 进度 的 天 数 0<r<100 
冰箱 冷冻 过 程 反应 发 生 的 温度 (5 下 一 5F) 一 5 下 委 z 委 5 下 


连续 型 随机 变量 和 离散 型 随机 变量 之 间 根 本 的 区 别 在 于 二 者 在 概率 分 布 计算 方法 上 的 
不 同 。 对 于 离散 型 随机 变量 ,概率 函数 f(z) 给 出 了 随机 变量 x 取 某 个 特定 值 的 概率 。 而 对 
连续 型 随机 变量 ,与 概率 函数 对 应 的 是 概率 密度 函数 (probability density function), id fF 
f(x)。 不 同 的 是 ,概率 密度 函数 并 没有 直接 给 出 概率 。 但 是 ,给 定 区 间 上 曲线 f(z) 下 的 面 
积 ,给 出 连续 型 随机 变量 在 该 区 间 取 值 的 概率 。 因 此 , 当 我 们 计算 连续 性 随机 变量 的 概率 
时 ,实际 上 计算 的 是 随机 变量 在 某 个 区 间 内 取 值 的 概率 。 
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正 态 分 布 (normal distribution) 是 描述 连续 型 随机 变量 最 重要 的 概 
率 分 布 ,在 统计 学 研究 领域 被 广泛 应 用 。 比 如 ,人 的 身高 和 体重 .考试 成 
绩 、 产 品质 量 检验 ,降雨 量 等 类 似 问 题 ,都 近似 服从 正 态 分 布 。 分 布 形 状 
如 图 5-2 所 示 。 


标准 差 c 


Path 
图 5-2 正 态 分 布 曲线 图 
正 态 分 布 是 一 条 钟 形 曲 线 , 其 概率 密度 函数 定义 如 下 : 


1 Zap? 


F= e 2? (5-1) 


o V2r 
上 式 中 ,y 是 均值 ;o 是 标准 差 ;x 为 3. 141 59;e WW 2.718 28, 
我 们 观察 到 正 态 分 布 的 一 些 特征 : 
d) 正 态 分 布 以 其 均值 为 对 称 轴 , 因 而 均值 与 中 位 数 、 众 数 完全 重合 。 
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(2) 分 布 曲线 以 轴线 为 渐 近 线 , 即 曲线 的 尾部 向 左右 两 边 无 限 延 伸 , 理 论 上 永远 与 横 轴 


不 相交 。 
G) 标准 差 决 定 了 正 态 曲线 的 扁平 度 。 较 大 的 标准 差 导致 了 较为 扁平 的 曲线 形态 , 表 


明了 数据 有 更 大 的 变异 性 。 如 图 5-3 所 示 。 


=10 四 
(a) 不 同 均值 、 相同 标准 差 的 正 态 分 布线 变化 (b) 相同 均值 、 不 同 标准 差 的 正 态 分 布 曲 线 变化 


图 5-3 不 同 均值 和 标准 差 的 正 态 分 布 曲 线 变化 
(4) 正 态 随机 变量 的 概率 由 正 态 曲 线 下 面积 给 出 ,总 面积 之 和 等 于 1。 由 于 正 态 曲线 的 
对 称 性 ,均值 左边 曲线 下 的 面积 等 于 均值 右边 曲线 下 的 面积 , 且 都 等 于 0. 5。 
观察 图 5-4 , 正 态 分 布 曲 线 显示 了 一 些 常 用 的 区 间 内 取 值 的 概率 和 性 质 。 
(1) 正 态 随机 变量 有 68. 3% 的 值 在 均值 加 减 一 个 标准 差 的 范围 内 。 
(2) 正 态 随机 变量 有 95. 4% 的 值 在 均值 加 减 两 个 标准 差 的 范围 内 。 
(3) 正 态 随机 变量 有 99.7% 的 值 在 均值 加 减 三 个 标准 差 的 范围 内 。 
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Hp-3a u20 Wlo pu plo pHo ta 
图 5-4 正 态 分 布 曲 线 下 的 面积 的 概率 


5.4.1 标准 正 态 分 布 


如 果 一 个 随机 变量 服从 均值 为 0、 标准 差 为 1 的 正 态 分 布 , 则 称 该 随机 变量 服从 标准 正 
态 分 布 (standard normal distribution) 。 通 常用 字母 x 表示 这 一 特殊 的 正 态 随机 变量 。 
图 5-5 是 标准 正 态 分 布 曲 线 图 , 它 与 正 态 分 布 有 相同 的 形状 ,不 同 的 是 标准 正 态 分 布 是 以 
/一 0 为 轴 的 对 称 图 形 ,. 且 vc 一 1。 
由 于 py 二 0,0 二 1, 标 准 正 态 分 布 的 概率 密度 函数 是 式 (5-1) 的 一 个 更 简单 的 形式 。 

1 er? 

f(z)= 7z (5-2) 
对 于 标准 正 态 分 布 , 正 态 曲线 下 的 面积 已 计算 出 来 并 已 编制 成 表 , 见 附录 表 1。 
例如 ,计算 标准 正 态 随机 变量 = 小 于 或 等 于 1. 00 的 概率 ,一 般 表示 为 POKI). EMRK 
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图 5-5 标准 正 态 分 布 曲线 图 


1 对 应 的 z=1. 00 的 行 标记 1.0, 列 标记 0. 00 相交 处 的 值 为 0. 841 3, 如 表 5-6 所 示 , 于 是 有 
P(z<1)=0. 841 3。 


表 5-6 标准 正 态 分 布 曲线 ( 单 侧 ) 下 面积 与 概率 表 ( 部 分 ) 


z 0. 00 0.01 0. 02 0. 03 0. 04 
0.9 0.815 9 0. 818 6 0.821 2 0. 823 8 0. 826 4 
1.0 0. 841 3 0. 843 8 0.846 1 0. 848 5 0. 850 8 
ii 0. 864 3 0. 866 5 0. 868 6 0. 870 8 0. 872 9 
t3 0. 884 9 0. 886 9 0. 888 8 0. 890 7 0. 892 5 
标准 正 态 随机 变量 x 是 连续 型 随机 变量 ,我 们 需要 计算 标准 正 态 随机 变量 三 种 情形 下 
的 概率 或 面积 : 


(1) 标准 正 态 随机 变量 = 小 于 或 等 于 一 个 给 定 的 值 ; 

(2) 标准 正 态 随机 变量 = 在 一 个 取 值 区 间 内 ; 

(3) 标准 正 态 随机 变量 x 大 于 或 等 于 一 个 给 定 的 值 。 

下 面 通过 具体 的 示例 来 说 明 上 述 三 种 情形 下 概率 的 计算 。 

例如 ,计算 标准 正 态 随机 变量 z 在 区 间 一 0. 50 一 1. 25 的 概率 即 P( 一 0. 50<2<1. 25), 
计算 这 一 概率 需要 经 过 三 个 步骤 ,首先 计算 ==1.25 左 侧 正 态 曲 线 下 的 面积 ;其 次 计算 
x 一 一 0. 50 左 侧 正 态 曲 线 下 的 面积 ;最 后 用 ==1. 25 左 侧 正 态 曲线 下 的 面积 减 去 z= 一 0. 50 
左 侧 正 态 曲线 下 的 面积 即 得 到 P( 一 0. 50<2<1. 25) ,如 图 5-6 所 示 。 


P(-0.50<z<1.25) 


P(z<—0.50) 


0.50 0 1.25 
5-6 随机 变量 z 在 区 间 一 0. 50 一 1. 25 的 分 布 曲线 下 的 面积 


为 了 得 到 < 二 1. 25 左 侧 正 态 曲线 下 的 面积 ,首先 在 标准 正 态 概率 表 中 找到 1.2 所 在 的 
行 , 然 后 移动 到 0. 05 所 在 的 列 . 相 交 处 的 表 值 为 0.894 4, 即 PC= 委 1.25) 王 0.894 4。 类 似 
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的 ,可 利用 附录 表 1 查 到 > 一 一 0. 50 左 侧 正 态 曲 线 下 的 面积 ,找到 一 0. 50 所 在 的 行 和 0. 00 
所 在 的 列 相交 处 的 表 值 是 0. 308 5, 即 P(z<—0.50)=0. 308 5。 
则 有 : 
P(—0. 50<z<1. 25) 
一 P(z< 秋 1. 25)— P(z<—0. 50) 
一 0.894 4 一 0.308 5 
一 0.585 9 
假定 ,我 们 想 计算 标准 正 态 随 机 变量 的 取 值 在 均值 一 个 标准 差 的 范围 内 的 概率 , 即 
P( 一 1.00<z 夸 1.00)。 为 了 计算 这 个 概率 ,我 们 必须 先 求 出 一 1.00 和 1. 00 之 间 曲 线 下 面 
的 面积 。 在 前 面 已 经 有 P(z 委 1) 王 0. 841 3。 再 次 查 附录 表 1, 得 到 P(x 二 一 1)==0. 158 7。 
则 有 
P(—1.00<z<1. 00) 
=P(z<1.00)—P(z<—1.00) 
=0. 841 3—0. 158 7 
一 0.682 6 
图 5-7 是 这 一 概率 的 图 形 显示 。 
P(-1.00<z<1.00) 
=P(z<1.00)—P(z<-1.00) 
=0.841 3-0. 1587 
=0.6826 


P(z<-1.00)=0.158 7 


-3 一 -l 0 1 2 3 
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图 5-7 随机 变量 < 在 区 间 一 1.00 一 1.00 的 概率 
为 了 说 明 如 何 计算 第 三 种 情形 的 概率 ,假定 要 计算 = 值 至 少 为 1. 58 的 概率 , 即 P(x 三 
1. 58) 。 标 准 正 态 分 布 概率 表 中 z=1.5 所 在 行 和 0.08 所 在 的 列 交叉 处 的 值 为 0.942 9; F 
是 P(z<1.58)=0.942 9。 然 而 ,要 计算 P(z 宇 1. 58) 的 概率 ,我 们 知道 ,曲线 下 面 的 总 面积 
等 于 1, 从 而 P(2>1. 58) =1— P(z<1. 58) =1—0. 942 9=0. 057 1。 图 5-8 所 示 显 示 了 这 一 
概率 。 


P(z<—1.58)=0.942 9 


P(z>1.58) 
=1-0.057 1=0.057 1 


3 2 -1 0 1 2 3 
z 


5-8 随机 变量 值 z BDA 1.58 的 概率 
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在 前 面 的 例子 中 ,我们 展示 了 如 何 计算 给 定 的 = 值 的 概率 。 
在 某 些 情况 下 ,我 们 更 感 兴趣 的 问题 是 知道 某 一 特定 值 的 概率 求 相 应 的 = 值 。 假 定 我 
们 想 知 道 一 个 大 于 = 值 、 概 率 为 0. 10 的 一 个 特定 值 是 多 少 ? 图 5-9 显示 了 这 一 情况 。 


概率 =0.10 


Asso 
图 5-9 概率 =0.10 时 随机 变量 z 的 取 值 

这 个 例子 与 前 面 的 例子 正好 相反 。 前 面 , 我 们 设 定 了 感 兴趣 的 = 值 ,然后 找到 相应 的 概 
率 。 本 例 中 ,我 们 给 定 概 率 , 要 求 找到 相应 的 x 值 ,我 们 可 以 利用 标准 正 态 分 布 概率 表 以 相 
反 的 方式 求 出 相应 的 = 值 。 已 知 P(z)==0.10, 因 此 ,在 未 知 = 值 左 侧 正 态 曲线 下 面积 是 
=1—0. 10=0. 900 0, 查 看 概率 表 , 表 值 最 接近 0. 900 0 的 累积 概率 值 是 0. 899 7, 与 其 相对 
应 的 行 和 列 的 z 值 是 1.28, 即 z=1. 28. RE. PC2<1. 28) =0. 900 0, 根 据 问题 的 最 初 提 法 ， 
z EKF 1. 28 的 概率 是 0. 10。 

这 些 例子 说 明了 标准 正 态 分布 概 率 表 可 以 求 出 标准 正 态 随机 变量 z 值 相 应 的 概率 ,也 
可 以 求 出 给 定 概率 或 面积 的 < 值 。 因 此 ,要 灵活 运用 标准 正 态 分 布 概率 表 来 回答 相关 的 问 
题 。 大 多 数 情况 下 , 夯 一 张 标准 正 态 分 布 曲线 图 并 用 阴影 表示 相应 的 面积 将 有 助 于 使 问题 
形象 化 ,以 帮助 我 们 确定 正确 的 答案 。 


5.4.2 正 态 分 布 概率 的 计算 


我 们 之 所 以 深入 讨论 标准 正 态 分 布 的 原因 在 于 ,所 有 正 态 分 布 的 概率 都 可 以 利用 标准 
正 态 分 布 来 计算 。 也 就 是 说 , 当 我 们 知道 一 个 具有 任意 均值 y 和 标准 差 o 的 正 态 分 布 时 ,就 
可 以 利用 标准 正 态 分 布 和 一 般 正 态 分 布 之 间 的 转换 关系 ,求解 服从 均值 为 x MEREEN o 
的 正 态 分 布 的 数据 集 分 布 的 概率 。 把 任意 正 态 随机 变量 x 转换 为 标准 正 态 随 机 变量 < 的 公 
式 是 


=7_# (5-3) 
o 


为 了 说 明 将 任意 的 正 态 随机 变量 转换 为 标准 随机 变量 ,假定 某 数据 集 服 从 于 均值 u= 
10 ,标准 差 o=2 的 正 态 分 布 , 那 么 随机 变量 zx 在 区 间 (10 一 14) 之 间 的 概率 是 多 少 ? 
“4 x=10 时 ,由 式 (5-3) 可 得 


-一 一 -10 一 10_ 
o 2 


当 z 一 14 时 ,由 式 (5-3) 可 得 


0 
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这 样 ,随机 变量 z 在 区 间 (10 一 14) 之 间 的 概率 问题 等 价 于 = 在 (0 一 2) 之 间 的 标准 正 态 
分 布 概率 问题 。 换 名 话说 ,我 们 利用 标准 正 态 分 布 概率 表 查 找 的 概率 值 是 随机 变量 zx 在 其 
均值 和 超过 均值 两 个 标准 差 的 值 之 间 的 概率 。 利 用 附录 表 1, 可 查 得 P(e < 2.00) = 
0. 977 2,P(z<0)=0. 500 0, 可 计算 : 
P(0<z<2.00)=P(z<2.00)—P(z<0) 
一 0. 977 2 一 0. 500 0 
=0.477 2 
此 ,随机 变量 z 在 区 间 (10 一 14) 之 间 的 概率 是 0. 477 2。 
接 下 来 ,通过 一 个 具体 的 实例 来 说 明正 态 分 布 的 应 用 。 
已 知 某 班 49 人 期 末 统 计 学 考试 平均 成 绩 是 85 分 ,标准 差 是 6 分 ,假设 此 项 考试 能 反映 
学 生 的 学 习 水 平 ,成 绩 分 布 服 从 正 态 分 布 , 试 计算 该 班 学 生 中 成 绩 在 70 一 80 之 间 的 人 数 。 
已 知 成 绩 (z) 服 从 均值 x 二 85, 标 准 差 o=2 的 正 态 分 布 , 求 二 在 区 间 (70 一 80) 之 间 的 概 
率 问 题 。 
求解 该 问题 首先 要 把 正 态 分 布 的 问题 转换 为 标准 正 态 分 布 的 问题 。 
4 x=70 时 ,由 式 (5-3) 式 可 得 


pa 一 85 
一 上 6 
o 6 


当 2=80 时 ,由 式 (5-3) 式 可 得 
z=7 880—850, 83 
o 6 
这 样 ,随机 变量 xz 在 区 间 (70 一 80) 之 间 的 概率 问题 等 价 于 = 在 (一 2.5 一 一 0.83) 之 间 的 
标准 正 态 分 布 概率 问题 。 由 附录 表 1 可 查 得 P(z 委 一 2.5) 王 0.017 5, P(z<— 0. 83) = 
0. 282 7, 这 一 取 值 区 间 的 概率 如 图 5-10 所 示 。 


P(-2.5<z<-0.83) 
P(<-0.83)-P(<-2.5) 
=0.282 7-0.017 5=0.265 2, 


3s 2 -1 0 T 2 3 
图 5-10 随机 变量 < 值 在 一 2. 5 一 一 0. 83 之 间 的 概率 
计算 得 : 
P(—2.5<z<—0. 83) 
P(z<—0. 83) —P(zX—2. 
=0. 282 7—0.017 5 
=0. 265 2 
因此 ,随机 变量 x 在 区 间 (70 一 80) 之 间 的 概率 是 0. 265 2。 
全 班 49 人 考试 成 绩 在 70~ 80 之 间 的 比例 是 0. 265 2, 这 个 分 数 区 间 的 人 数 是 49 X 
0. 265 2=13 A. 
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PANI 
用 Excel 计算 正 态 分 布 概率 值 


用 Excel 计算 正 态 分 布 概率 值 的 步骤 如 下 : 

(1) 进入 Excel 表格 界面 。 

(2) 在 Excel 表格 界面 ,直接 单 击 ”" fz”( 插 和 函数) 命令 。 

(3) 在 复 选 框 “函数 分 类 ”中 选择 “统计 ”选项 ,并 在 "函数 名 ”中 单 击 "NORMDIST” 选 
项 ,再 单 击 “ 确 定 ”。 

(4) 在 出 现 “NORMDIST” 对 话 框 后 : 

在 “X” 后 填 入 正 态 分 布 函 数 计算 的 正 态 随机 变量 值 ( 即 zx)( 本 例 中 为 70); 

在 “Mean” 后 填 人 正 态 分 布 的 均值 w( 本 例 为 50); 

在 “Standard_dev” 后 填 和 人 正 态 分 布 的 标准 差 a( 本 例 为 10); 

在 “Cumulative” 后 填 和 人 “TRUE( 累 计 分 布 函数 )”(FALSE 表示 概率 密度 函数 ) 。 

输入 完毕 , 单 击 “ 确 定 ”。 单 击 “ 确 定 ” 后 出 现 的 对 话 框 ,如 图 5-11 所 示 。 


NORMDIST 
x 
Mean 
Standard_dev 


Cumulative 


Cumulative pop Era ate RRITEN 使 用 TRUES 


图 5-11 “函数 参数 "对 话 框 


同样 ,也 可 以 用 Excel 提供 的 统计 函数 NORMSDIST 计算 标准 正 态 分 布 的 累计 概率 。 
具体 操作 步骤 与 上 述 方法 类 似 , 不 再 示例 。 
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1. 以 下 数据 是 某 市 医院 20 天 内 手术 室 使 用 情况 :有 3 天 只 使 用 1 间 , 有 5 天 使 用 2 间 ， 
有 8 天 使 用 3 间 , 有 4 天 医院 的 4 间 手 术 室 都 被 使 用 。 

(1) 对 一 天 中 手术 室 的 使 用 间 数 编制 概率 分 布 。 

(2) 绘制 概率 分 布 图 。 

G) 说 明 这 个 概率 分 布 满足 离散 型 概率 分 布 的 有 效 条 件 。 

2. K 5-7 是 APP 公司 第 一 年 预计 的 营业 利润 的 部 分 概率 分 布 ,z 一 利润 (单位 :万 元 )， 
负 值 表示 亏损 。 
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表 5-7 题 2 的 概率 分 布 


工 f(x) z Fa) 

—100 0.10 100 0. 25 
0 0. 20 150 0. 10 
50 0. 30 200 


(1) f(200) 的 值 是 多 少 ? 如 何 解释 这 个 值 ? 

(2) APP 公司 赢利 的 概率 是 多 少 ? 

(3) APP 至 少 赢利 100 000 万 元 的 概率 是 多 少 ? 

3. 已 知 = 是 一 个 标准 正 态 随 机 变量 ,计算 下 列 概率 。 
(1) PWO<z2<0. 83); 

(2) P(—1.57<z<0); 

(3) P(z>0. 44); 

(4) P(z>—0. 23); 

(5) P(z<1. 20); 

(6) P(z<—0. 71). 

4. 已 知 = 为 一 个 标准 正 态 随机 变量 ,对 于 下 面 每 一 种 情况 , 求 出 = 值 。 
A) < 左 侧 的 面积 是 0. 975 0; 


(2) 0 和 


z 之 间 的 面积 是 0. 457 0; 


(3) < 左 侧 的 面积 是 0. 729 1; 

(4) x 布 侧 的 面积 是 0. 131 4; 

(5) = 左 侧 的 面积 是 0. 670 0; 

(6) < 布 侧 的 面积 是 0. 330 0。 

5. 苹果 公司 股票 去 年 200 个 交易 日 平均 价格 是 30 美元 ,标准 差 是 5. 2 美元。 假定 股票 
价格 的 波动 服从 正 态 分 布 。 


EDEN 


(2) 公司 
(3) 公司 


的 股票 价格 至 少 为 40 美元 的 概率 是 多 少 ? 
的 股票 价格 不 超过 20 美元 的 概率 是 多 少 ? 
的 股票 价格 在 25 一 35 美元 之 间 波 动 的 概率 是 多 少 ? 


6. 在 过 去 的 一 个 月 ,手机 互联 网 用 户 在 工作 时 平均 花 77 个 小 时 登录 互联 网 。 假 设 工作 
时 间 服 从 正 态 分 布 ,总 体 均值 为 77 小 时 ,标准 差 为 20 小 时 。 


《TD 一 个 
多 少 ? 
(2) 过 去 


随机 选取 的 用 户 在 过 去 一 个 月 内 登录 互联 网 的 时 间 少 于 50 个 小 时 的 概率 是 


一 个 月 里 登录 互联 网 的 时 间 多 于 100 小 时 的 用 户 比 例 有 多 大 ? 


G) 如 果 把 登录 互联 网 的 时 间 排 在 前 20% 的 位 置 认为 该 用 户 是 互联 网 的 过 度 使 用 
者 。 那 么 ,一 个 过 度 使 用 互联 网 的 用 户 在 过 去 一 个 月 内 登录 互联 网 的 时 间 至 少 应 该 是 多 


少 小 时 ? 


7. 假设 某 大 学 入 学 考试 的 考试 成 绩 服 从 正 态 分 布 , 均 值 为 450 分 ,标准 差 为 100 分 。 
(1) 考试 成 绩 在 400 一 500 分 的 人 数 占 多 大 比例 ? 


(2) 假定 


某 考生 成 绩 是 630 分 ,那么 ,考试 成 绩 超过 630 分 的 考生 人 数 占 多 大 比例 ? 考 
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试 成 绩 低 于 630 分 的 考生 占 多 大 比例 。 
(3) 如 果 该 大 学 不 录取 低 于 480 分 的 考生 ,那么 ,参加 考试 的 考生 中 被 该 大 学 录取 的 比 
例 有 多 大 ? 假定 此 次 参加 考试 人 数 是 890 人 .那么 有 多 少 人 会 被 淘汰 ? 


ane 


随机 变量 是 对 试验 结果 的 数值 描述 。 随 机 变量 的 概率 分 布 描述 了 随机 变量 取 值 不 同 的 
概率 。 对 任何 离散 型 随机 变量 zx, 可 以 通过 概率 函数 来 定义 概率 分 布 , 记 作 f(x)。 它 给 出 了 
随机 变量 每 一 个 值 的 概率 。 

我 们 还 把 概率 分 布 的 讨论 推广 到 了 连续 型 随机 变量 的 情况 。 离 散 型 随机 变量 和 连续 型 
随机 变量 概率 分 布 的 主要 区 别 在 于 计算 概率 的 方法 不 同 。 对 连续 型 随机 变量 的 概率 分 布 ， 
我 们 用 一 个 概率 密度 函数 /(z) 来 描述 ,不 能 直接 给 出 概率 值 。 概 率 是 通过 概率 密度 函数 曲 
线 下 的 面积 给 出 。 

标准 正 态 分 布 是 正 态 分 布 在 均值 x 二 0. 标 准 差 oO = 1 时 的 一 类 特殊 情形 ,用 > 来 表示 。 
通过 标准 正 态 分 布 和 一 般 正 态 分 布 之 间 的 转换 关系 ,我 们 可 以 计算 任意 正 态 随机 变量 值 的 
概率 。 也 可 以 通过 标准 正 态 分 布 概率 表 在 已 知 某 正 态 随机 变量 的 概率 时 ,确定 相应 的 = 值 。 

通过 一 些 实例 ,我 们 讨论 了 不 同情 形 下 正 态 随机 变量 的 计算 ,这 些 练习 也 将 有 助 于 我 们 
理解 正 态 分 布 在 统计 推断 中 的 应 用 方法 。 
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>> > | 实践 中 的 统计 
抽样 调查 : 谁 能 当选 总 多 


1936 年 美国 总 统 竞选 时 ,民意 调查 机 构 向 1 000 万 选民 寄 去 了 调查 问卷 ,这 些 选民 的 名 
单 是 从 电话 簿 ,俱乐部 名 册 及 杂志 的 订户 中 随机 挑选 的 。 结 果 在 寄 出 的 1 000 万 份 调查 问 
卷 中 , 约 有 240 万 的 选民 寄 回 了 调查 表 。 根 据 这 部 分 选民 的 回答 ,调查 机 构 预 测 共 和 党 的 布 
兰 登 将 当选 。 但 选举 那天 的 结果 完全 出 乎 他 们 的 意料 ,选民 中 只 有 38% 人 投了 共和 党 的 票 ， 
而 民主 党 的 罗斯 福 以 多 数 票 当 选 。 

调查 机 构 采 用 了 1000 万 的 巨大 样本 ,为 何 预测 会 失败 呢 ? 原来 20 世纪 30 年 代 是 美国 
经 济 衰退 的 时 期 , 那 时 能 够 安装 电话 、 加 入 俱乐部 或 能 订阅 杂志 的 美国 人 较为 富裕 ,大 部 分 
支持 共和 党 。 也 就 是 说 调查 机 构 选 择 的 样本 虽然 巨大 却 存 在 偏差 ,样本 不 具有 广泛 性 和 代 
表 性 。 

这 一 事例 表明 ,抽样 调查 时 既 要 关注 样本 的 大 小 ,又 要 关注 样本 的 代表 性 。 那 是 不 是 
说 ,在 样本 具有 代表 性 的 情况 下 ,样本 越 大 越 好 呢 ? 一 般 来 说 ,在 样本 具有 代表 性 的 情况 
下 ,样本 增 大 ,所 得 结果 误差 会 减 小 。 但 是 当 样 本 大 到 一 定 程度 之 后 ,再 增加 样本 ,精确 度 
的 增加 却 是 微小 的 ,同时 巨大 的 样本 不 仅 耗 资 太 大 ,也 不 便于 管理 。 因 此 ,在 进行 抽样 调 
查 时 ,关键 在 于 精心 设计 抽样 方案 ,选择 有 代表 性 的 样本 ,这 样 , 才 可 能 作出 接近 真实 情况 
的 预测 。 

本 项 目 将 学 习 一 些 简单 的 抽样 方法 ,以 及 如 何 利用 一 些 样本 的 统计 量 来 推断 和 估计 总 体 
分 布 特征 。 我 们 抽取 样本 的 目的 就 是 为 了 回答 关于 总 体 的 一 些 未 知 的 分 布 特征 。 但 是 ,抽样 
结果 只 是 提供 了 相应 总 体 特 征 的 一 些 估计 ,认识 这 一 点 非常 重要 。 原 因 很 简单 ,样本 只 是 包含 
了 总 体 的 一 部 分 信息 ,而 非 全 部 ,因此 可 以 预见 ,一 定 会 存在 抽样 误差 。 利 用 适当 的 抽样 方法 ， 
抽样 结果 可 以 给 出 关于 总 体 参 数 的 一 个 “好 ?的 估计 。 本 项 目 首先 阐明 如 
何 采 用 简单 随机 抽样 从 一 个 有 限 总 体 中 选取 样本 ,以 及 如 何 从 一 个 持续 运 
行 过 程 的 无 限 总 体 中 ,描述 如 何 从 中 选取 随机 样本 。 然 后 ,我 们 说 明 如 何 
利用 抽样 得 到 的 数据 来 推断 总 体 分 布 特征 的 估计 值 。 


[6. 1 “抽样 与 抽样 方法 


先 定义 一 些 抽样 的 术语 。 我 们 把 抽取 样本 的 总 体 称 为 抽样 总 体 (sampled population)， 
把 用 于 抽 选 样本 的 个 体 清单 称 为 抽样 框 (frame) 。 


> 6.1.1 从 有 限 总 体 抽样 


从 有 限 总 体 抽样 时 ,一 般 采 用 概率 抽样 ,因为 基于 概率 抽样 的 样本 可 以 对 总 体 进行 有 效 
的 推断 统计 。 从 容量 为 N 的 有 限 总 体 中 抽取 一 个 容量 为 n 的 样本 ,如 果 容 量 为 的 每 一 个 
可 能 的 样本 都 以 相同 的 概率 被 抽 到 , 则 称 该 样本 为 简单 随机 样本 (simple random sample). 

从 有 限 总 体 中 抽取 简单 随机 样本 时 ,每 次 只 选择 一 个 个 体 ,总 体 中 的 每 一 个 个 体 都 以 相 
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同 的 概率 被 抽 到 。 但 在 选取 个 体 时 ,把 先前 已 经 出 现 过 的 样本 排除 在 外 ,这 种 选择 样本 的 方 
法 称 为 无 放 回 抽样 。 如 果 我 们 在 选择 样本 时 ,对 已 经 出 现 过 的 样本 仍 放 回 总 体 ,那么 某 些 在 
此 之 前 被 抽 到 过 的 样本 有 可 能 被 多 次 地 抽取 出 来 ,我 们 把 这 种 选择 样本 的 方法 称 为 有 放 回 
抽样 ,也 称 为 重复 抽样 。 

一 般 情况 下 ,无 放 回 抽样 是 一 种 取得 简单 随机 样本 的 有 效 途 径 , 在 抽样 方法 中 更 为 常 


用 。 假设 我 们 从 一 个 容量 为 N 的 有 限 总 体 中 抽样 ,可 以 选取 样本 容量 为 的 = 六 
个 简单 随机 样本 。 式 中 NI 和 ?1 都 是 有 限 总 体 N 和 样本 容量 的 阶乘 。 


> 6. 1.2 从 无 限 总 体 抽样 


有 时 ,从 总 体 中 抽取 样本 ,但 是 总 体 容量 无 限 大 或 者 总 体 中 的 个 体 是 由 一 个 正在 运行 的 
过 程 中 产生 的 ,从 而 生成 的 个 体 数 量 是 无 限 的 。 这 时 候 就 无 法 得 到 总 体 中 所 有 个 体 的 清单 ， 
这 是 无 限 总 体 的 情形 。 对 于 无 限 总 体 ,由 于 无 法 构建 一 个 包含 全 部 个 体 的 抽样 框 ,因此 无 法 
抽取 一 个 简单 随机 样本 。 

如 果 从 一 个 无 限 总 体 中 抽取 一 个 容量 为 n 的 样本 ,必须 要 满足 两 个 条 件 : 

(1) 确保 抽取 的 每 个 个 体 来 自 于 同一 个 总 体 。 

(2) 每 一 个 个 体 的 抽取 是 独立 的 。 

因此 ,在 无 限 总 体 中 抽取 随机 样本 时 ,必须 小 心 并 仔细 判断 ,每 一 种 情况 可 能 需要 不 同 
的 抽取 程序 。 我 们 通过 两 个 例子 来 说 明 其 含义 。 

在 质量 控制 过 程 中 ,生成 过 程 是 连续 的 而 且 产品 数量 是 无 限 的 。 抽 样 总 体 由 正在 运行 
的 生产 过 程 生产 的 全 部 产品 组 成 ,而 不 仅仅 是 由 那些 已 经 生产 的 产品 组 成 。 因 为 我 们 不 可 
能 列 出 一 个 生产 的 全 部 产品 的 清单 ,所 以 认为 总 体 是 无 限 的 。 更 具体 地 ,为 判断 生产 线 是 否 
正常 运行 还 是 由 于 机 器 故障 使 得 生产 线 的 产品 的 出 现 问题 ,一 位 质量 控制 检验 员 定 期 从 生 
产 线 上 抽取 12 个 产品 组 成 一 个 样本 。 

在 这 样 一 个 生产 操作 中 ,选取 一 个 随机 样本 时 最 关心 的 是 条 件 (1) ,为 了 确保 这 一 条 件 
成 立 ,必须 在 近似 相同 的 时 点 选择 产品 。 这 样 才能 避免 抽取 的 某 些 样本 来 自生 产 线 正 常 运 
行 时 ,而 有 一 些 样本 是 生产 线 非 正常 运行 时 。 在 诸如 这 样 的 一 个 环节 中 ,设计 的 生产 流程 应 
确保 每 个 样本 时 独立 抽取 的 ,从 而 满足 条 件 (2) 。 


>6.1.3 抽样 误差 


我 们 把 抽样 的 样本 统计 量 与 所 要 估计 的 总 体 参数 之 间 的 差 值 称 为 抽样 误差 。 抽 样 误差 
的 大 小 能 够 说 明 抽样 样本 估计 总 体 是 否 可 行 , 抽 样 效果 是 否 理想 等 问题 。 常 见 的 抽样 误差 
有 均值 误差 与 比例 误差 。 下 面 通过 一 个 例子 来 说 明 误差 产生 的 原因 。 

某 年 级 100 名 同学 的 平均 体重 w= 55kg, 现 随机 地 抽取 10 名 同学 为 样本 ,其 平均 体重 
二 52kg。 若 用 52kg 估计 55kg, 则 误差 为 52 一 55 一 一 3kg, 如 果 重 新 抽 10 名 同学 , 若 测 得 
元 一 57kg, 则 其 误差 为 2kg。 这 种 只 抽取 部 分 样本 而 产生 的 误差 ,都 被 称 为 抽样 误差 。 

由 本 例 不 难看 出 ,抽样 误差 既是 一 种 随机 性 误差 .也 是 一 种 代表 性 误差 。 说 其 是 代表 性 
误差 ,是 因为 利用 总 体 的 部 分 资料 推断 总 体 时 ,不 论 样 本 选取 有 多 么 公正 ,设计 多 么 完善 ,总 
还 是 一 部 分 单位 而 不 是 所 有 单位 ,产生 误差 是 无 法 避免 的 。 说 其 是 随机 性 误差 ,是 指 按 随机 
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性 原则 抽样 时 ,由 于 抽样 的 不 同 ,会 得 到 不 同 的 抽样 观测 值 ,由 此 产生 的 误差 值 各 不 相同 。 
抽样 误差 中 的 代表 性 误差 是 抽样 调查 本 身 所 固有 的 、 无 法 避免 的 误差 ,但 随机 性 误差 则 可 利 
用 大 数 定律 精确 地 计算 并 能 够 通过 抽样 设计 程序 加 以 控制 。 


[6. 2 抽样 推断 | 2 ”抽样 推断 


抽样 推断 的 理论 基础 主要 是 概率 论 极 限定 理 中 的 大 数 定律 与 中 心 极 限定 理 。 


i 大 数 定律 


大 数 定律 是 指 在 随机 试验 中 ,每 次 出 现 的 结果 不 同 , 但 是 大 量 重复 试验 出 现 的 结果 的 平 
均值 却 几乎 总 是 接近 于 某 个 确定 的 值 。 其 原因 是 ,在 大 量 的 观察 试验 中 ,个 别 的 ,偶然 的 因 
素 影响 而 产生 的 差异 将 会 相互 抵消 ,从 而 使 观测 值 的 必然 规律 性 显示 出 来 。 

例如 ,观察 个 别 或 少数 家 庭 的 婴儿 出 生 情 况 ,发 现 有 男 有 女 ,没有 一 定 的 规律 性 ,但 是 通 
过 大 量 的 观察 就 会 发 现 , 男 婴 和 女 婴 占 婴 儿 总 数 的 比重 均 会 趋 于 50% 。 

将 该 定律 应 用 于 抽样 调查 ,就 会 有 如 下 结论 : 随 着 样本 容量 ”的 增加 ,样本 平均 数 将 接 
近 于 总 体 平均 数 , 从 而 为 统计 推断 中 依据 样本 平均 数 估计 总 体 平均 数 提供 了 理论 依据 。 


B 中 心 极限 定理 


大 数 定律 揭示 了 大 量 随机 变量 的 平均 结果 ,但 没有 涉及 随机 变量 的 分 布 的 问题 。 而 
中 心 极限 定理 说 明 的 是 在 一 定 条 件 下 ,大 量 独立 随机 变量 的 平均 数 是 以 正 态 分 布 为 极 
限 的 。 

将 该 定理 应 用 到 抽样 调查 ,就 有 这 样 一 个 结论 :如 果 抽样 总 体 的 数学 期 望 E(x) 和 方差 
中 是 有 限 的 ,无 论 总 体 服 从 什么 分 布 ,从 中 抽取 容量 为 的 样本 时 ,只 要 足够 大 ,其 样本 平 
均 数 的 分 布 就 趋 于 数学 期 望 为 E(z) ,方差 为 o?/n 的 正 态 分 布 , 且 相 对 频数 近似 服从 正 态 
分 布 。 


[6. 3 “抽样 分 布 | 3“ 抽 样 分 布 


抽样 分 布 (sampling distribution) 是 指 样本 统计 量 的 概率 分 布 。 例 如 ,我 们 把 抽取 一 个 
简单 随机 样本 的 过 程 看 作 一 个 试验 , 则 样本 均值 就 是 试验 结果 的 一 个 数值 描述 。 从 而 ,样本 
均值 + 是 一 个 随机 变量 。 因 此 ,就 像 其 他 随机 变量 一 样 ,+ 也 有 其 均值 (数学 期 望 ) EE A 
概率 分 布 。 由 于 各 种 的 可 能 值 是 不 同 简单 随机 样本 的 结果 ,因此 ,的 概率 分 布 叫 作 的 
抽样 分 布 。 随 机 变量 是 统计 学 研究 的 对 象 ,抽样 是 推断 统计 的 基本 方法 ,一 般 通过 描述 样本 
统计 量 的 分 布 特征 ,比如 样本 均值 、 样 本 方差 .标准 差 、 样 本 比例 等 ,来 推断 总 体 参 数 的 分 布 
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> 6. 3. 1 X 抽 样 分 布 的 形成 过 程 


为 了 更 好 地 理解 抽样 分 布 的 概念 ,我 们 通过 一 个 例子 来 具体 讨论 。 

假设 一 个 总 体 含有 4 个 个 体 ,总 体 N= 二 4。4 个 个 体 的 取 值 分 别 是 zi 二 1,zxs 一 2,zs 一 3， 
24 一 4。 从 总 体 中 采取 重复 抽样 的 方法 抽取 容量 为 n=2 的 随机 样本 。 此 时 ,我 们 注意 到 ,总 
体 分 布 为 均匀 分 布 , 即 zx; 取 每 一 个 值 的 概率 是 相同 的 。 


总 体 均值 : 
de 10 . 
a ih omic 
总 体 方差 : 
Dm 
= 
s 4 4 


重复 抽样 条 件 下 ,抽取 容量 "一 2 为 的 随机 样本 共有 4 = 16 个 可 能 的 样本 。 然 后 计算 
每 个 样本 的 均值 + 和 方差 ,结果 见 表 6-1。 


表 6-1 16 个 样本 均值 x 和 方差 5? 


n 样本 组 样本 均值 样本 方差 8° 
1 1,1 1.0 0 
2 1,2 1.5 0.5 
3 Is 2.0 2.0 
4 1.4 25 4.5 
5 2,1 ig 0.5 
6 2,2 2.0 0 
7 2y3 21.5 0.5 
8 2,4 3.0 2.0 
9 3,1 2.0 2.0 
10 3,2 25 0.5 
11 3.3 3.0 0 
12 3,4 a5 0.5 
13 4,1 BS 4.5 
14 4,2 3 2.0 
15 4,3 25 0.5 
16 4,4 4.0 0 
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整理 样本 均值 分 布 , 见 表 6-2. 
表 6-2 样本 均值 x 的 分 布 


均值 THT TRR P) 
1.0 1 1/16 

1.5 2 2/16 

2.0 3 3/16 

2.5 4 4/16 

3.0 3 3/16 

3.5 2 2/16 

4.0 1 1/16 


图 6-1 所 示 是 样本 z 的 抽样 分 布 。 


P(x) 
0.3r 


0.2- 


0.1r 


*I 


05 10 15 20 25 30 35 40 
图 6-1 样本 x 的 抽样 分 布 


上 例 抽样 过 程 及 抽样 分 布 可 以 概括 成 图 6-2 所 示 。 


抽取 容量 为 "的 
Pi ERA 


计算 每 一 个 样本 
的 均值 x 


6-2 x 的 抽样 过 程 与 抽样 分 布 
在 实际 应 用 中 ,我 们 不 仅 关心 均值 + 的 抽样 分 布 ,还 要 知道 抽样 分 布 的 性 质 ,包括 的 
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均值 标准 差 和 抽样 分 布 的 形状 等 。 


P> 6.3.2 x 抽样 分 布 的 形式 


均值 < 的 抽样 分 布 形式 与 样本 容量 n 的 大 小 有 关 。 如 果 总 体 服从 正 态 分 布 ,那么 ,无 论 
样本 容量 的 大 小 ,样本 均值 的 抽样 分 布 都 服从 于 正 态 分 布 。 

假定 一 个 总 体 的 分 布 未 知 或 者 是 非 正 态 分 布 的 ,抽样 后 分 布 是 一 种 怎样 的 形态 呢 ? 根 
据 中 心 极 限定 理 , 随 着 样本 容量 的 增 大 ,不 论 原来 的 总 体 是 否 服从 正 态 分 布 , 样 本 均值 的 抽 
样 分 布 都 将 趋 于 正 态 分 布 , 其 分 布 的 数学 期 望 为 总 体 均值 .方差 为 总 体 方差 的 1/n。 这 里 
所 谓 的 充分 大 ,一 般 为 mn 三 30。 图 6-3 显示 随 着 样本 容量 的 增 大 ,均值 抽样 分 布 趋 于 正 态 


分 布 的 过 程 。 
总 休 I 总 体 下 kI 
1 i | 
总 体 的 分 布 | | VV NO 
EEP R: T 
六 的 抽样 分 布 t t | 
"PUEL G 
= z E 
\ | 
的 抽样 分 布 
> JL FaN N. 
= = = 
\ | 
的 抽样 分 布 
(n=30) 
3 a e 


6-3 ”样本 均值 x 的 抽样 分 布 随 n 变化 趋 于 正 态 分布 的 过 程 


如 果 总 体 不 是 正 态 分 布 , 当 为 小 样本 时 ,样本 均值 的 分 布 则 不 是 正 态 分布 , 这 时 就 不 
能 按 正 态 分 布 来 推断 总 体 均值 。 


6. 3.3 x 抽样 分 布 的 特征 
讨论 样本 均值 和 总 体 均 值 的 关系 。 


一 一 由 
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我 们 已 计算 出 总 体 均值 为 
da 10 
a T 2:5 
总 体 方差 为 
Sep? < 
= i=l ER 2 
p= F 1. 25 
我 们 把 抽样 的 均值 称 为 数学 期 望 , 记 作 E(z)。 以 表 6-1 数据 为 例 , 有 
数学 期 望 : 
a ed _ 40 _ 
E(x) = —— = 16 25 
样本 均值 的 方差 为 


2 [aE 10 
2 i=l We — 
OF a 16 0. 625 


由 计算 结果 可 知 , 样 本 均值 的 数学 期 望 等 于 总 体 均值 , 即 EGO =p 
在 重复 抽样 的 条 件 下 ,样本 均值 的 方差 为 总 体 方差 的 1/n, 即 0 一 了 o?。 


在 不 重复 抽样 的 条 件 下 ,样本 均值 的 方差 则 需要 用 修正 系数 今 二 ?去 修正 重复 抽样 均值 


的 方差 , 即 o4 -< (N=), 


这 些 结论 ,可 以 通过 表 6-1 进行 了 验证 。 当 N 很 大 时 , 则 抽样 比 n/N 趋 小 ,其 修正 系数 


AUF 1, 此 时 在 计算 样本 均值 的 方差 时 可 由 ok = o ?来 计算 。 


如 果 均 值 的 抽样 分 布 服 从 均值 为 y、 标 准 差 为 乒 的 正 态 分 布 , 即 3~N (1.5) wE 
n 


n 


zp 
Ba RA NC 1%s 


ETD 4 ”参数 估计 


由 样本 提供 的 信息 对 总 体 的 分 布 和 分 布 的 特征 进行 估计 是 统计 推断 的 基本 问题 。 如 果 
总 体 的 分 布 类 型 已 知 ,而 其 参数 未 知 ,由 样本 统计 量 对 总 体 的 未 知 参数 作出 推断 ,这 就 是 参 
数 估计 。 参 数 估 计 主 要 包括 参数 的 点 估计 和 区 间 估 计 。 假 设 总 体 包含 未 知 参数 0, zi ,zs， 
ay ttt ,是 从 该 总 体 抽 取 的 一 个 样本 ,依据 合理 的 原理 构造 统计 量 , 以 此 作为 参数 9 的 估计 ， 
那么 这 个 统计 量 就 是 0 的 一 个 估计 量 或 点 估计 量 , 常 常用 六 表示 9 的 点 估计 。 需 要 说 明 的 是 
估计 量 是 随机 变量 ,估计 值 是 具体 数值 ,多 用 于 实际 应 用 和 计算 。 估 计 值 六 虽然 给 人 一 个 明 
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确 的 数量 概念 ,但 还 是 不 够 的 ,因为 它 只 是 参数 9 的 一 种 近似 值 , 而 点 估计 本 身 既 没有 反映 
这 种 近似 的 精确 度 ,又 没有 体现 误差 范围 及 在 该 误差 范围 内 的 可 能 性 ( 即 概率 )。 解 决 点 估 
计 的 这 一 问题 的 一 种 方法 是 区 间 估 计 。 

在 点 估计 的 基础 上 ,根据 样本 统计 量 构造 出 一 个 随机 区 间 ,该 随机 区 间 包 含 未 知 参 数 的 
概率 为 某 一 事先 指定 的 值 , 这 样 的 区 间 称 为 参数 的 置信 区 间或 区 间 估 计 , 置 信 区 间 的 一 个 或 
两 个 端点 是 随机 的 。 当 置信 区 间 的 端点 由 实际 样本 数据 计算 出 来 之 后 , 它 就 成 为 一 个 固定 
的 区 间 , 和 前 面 类 似 , 这 个 具体 的 区 间 就 是 置信 区 间 观 测 值 或 区 间 估 计 值 。 置 信 区 间 可 以 分 
为 双 侧 置信 区 间 和 单 侧 置信 区 间 。 双 侧 置信 区 间 的 两 个 端点 都 是 随机 的 ,而 单 侧 置 信 区 间 
只 有 一 个 端点 是 随机 的 。 


了 > 6.4.1 点 估计 与 区 间 估 计 


点 估计 (point estimate) 是 用 样本 统计 量 六 的 某 个 取 值 直接 作为 总 体 参数 9 的 估计 值 。 
比如 ,用 样本 均值 直接 作为 总 体 均值 y 的 估计 值 ,用 样本 比例 p 直接 作为 总 体 比例 x 的 佑 
计 值 ,用 样本 方差 s* 直接 作为 总 体 方差 "的 估计 值 。 假 定 要 估计 一 个 班 学 生 考 试 成 绩 的 平 
均 分 数 ,根据 抽出 的 一 个 随机 样本 计算 的 平均 分 数 为 80 分 ,用 80 分 作为 全 班 平均 考试 分 数 
的 一 个 估计 值 ,这 就 是 点 估计 。 如 果 要 估计 一 批 产品 的 合格 率 , 根 据 抽样 结果 合格 率 为 
96% ,将 96% 直 接 作为 这 批 产品 合格 率 的 估计 值 ,这 也 是 一 个 点 估计 。 

虽然 在 重复 抽样 条 件 下 ,点 估计 的 均值 等 于 总 体 均值 。 但 由 于 样本 是 随机 的 ,抽出 一 个 
具体 的 样本 得 到 的 估计 值 很 可 能 不 同 于 总 体 真 值 。 在 用 点 估计 值 代表 总 体 参 数值 的 同时 ， 
还 必须 给 出 点 估计 值 的 可 靠 性 ,也 就 是 说 ,我 们 必须 能 说 明 点 估计 值 与 总 体 参 数 的 真实 值 接 
近 的 程度 。 但 一 个 点 估计 量 的 可 靠 性 是 由 它 的 抽样 标准 误差 来 衡量 的 ,这 表明 一 个 具体 的 
点 估计 值 无 法 给 出 估计 的 可 靠 性 度量 ,因此 就 不 能 完全 依赖 于 一 个 点 估计 值 ,而 是 围绕 点 估 
计 值 构造 总 体 参数 的 一 个 区 间 , 这 就 是 区 间 估 计 。 

区 间 估 计 (interval estimate) 是 在 点 估计 的 基础 上 给 出 总 体 参 数 估 计 的 一 个 范围 。 总 体 
参数 的 估计 区 间 通 常 是 由 样本 统计 量 加 减 抽 样 误差 而 得 到 的 。 与 点 估 
计 不 同 , 进 行 区 间 估 计时 ,根据 样本 统计 量 的 抽样 分 布 可 以 对 样本 统计 
量 与 总 体 参 数 的 接近 程度 给 出 一 个 概括 度量 。 下 面 的 例子 说 明了 如 何 
在 点 估计 的 基础 上 构造 一 个 区 间 估 计 。 

为 了 计算 cz ,我 们 必须 知道 总 体 c。 为 了 强调 cz 与 o 的 不 同 , 我 们 
称 工 的 标准 差 cz 为 均值 的 标准 误差 (standard error) , 即 oz =- 由 此 
可 知 ,样本 均值 坏 落 在 总 体 均值 y 的 两 侧 各 为 一 个 标准 差 范 围 内 的 概率 是 0. 682 6, 两 个 标 
准 差 范围 内 的 概率 为 0.954 4, 三 个 标准 差 范 围 内 的 概率 是 0.997 2。 如 图 6-4 所 示 。 

实际 上 ,此 时 可 以 求 出 样本 均值 二 落 在 总 体 均值 的 两 侧 任何 一 个 抽样 标准 差 值 
范围 的 概率 。 但 实际 估计 时 ,情况 恰好 相反 。z 是 已 知 的 ,而 yy 是 未 知 的 ,也 正 是 将 要 
估计 的 。 由 于 与 4 的 距离 是 对 称 的 ,如 果 某 个 样本 的 平均 值 落 在 y 的 两 个 标准 差 范 
围 之 内 。 反 过 来 ,ux 也 被 包括 在 以 为 中 心 左右 的 两 个 标准 差 范围 之 内 ,因此 约 有 95% 
的 样本 均值 会 落 在 y 的 两 个 标准 差 的 范围 内 。 也 就 是 说 , 约 有 95% 的 样本 均值 所 构造 
的 两 个 标准 误差 的 区 间 会 包括 uw。 简单 地 说 ,如 果 抽 取 100 个 样本 来 估计 总 体 的 均值 ， 
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图 6-4 区 间 估 计 示 意图 
由 100 个 样本 所 构造 的 100 区 间 中 , 约 有 95 个 区 间 包 含 总 体 均值 ,而 另外 5 个 区 间 则 
不 包括 总 体 均 值 。 

在 某 种 程度 上 ,我 们 确信 这 个 区 间 包 含 真正 的 总 体 参 数 , 由 样本 统计 量 所 构造 的 总 
体 参 数 的 估计 区 间 , 称 为 置信 区 间 (confidence interval) ,区 间 的 最 小 值 称 为 置信 下 限 ,最 
大 值 称 为 置信 上 限 。 也 就 是 说 ,由 100 个 样本 构造 的 总 体 参数 的 100 个 置信 区 间 中 ,有 
95% 的 区 间 包 含 了 总 体 参 数 的 真 值 ,而 5% 则 没有 包含 , 则 95% 这 个 值 被 称 为 转 信 
水 平 。 

如 果 将 构造 署 信 区 间 的 步骤 重复 多 次 ,置信 区 间 中 包含 总 体 参 数 真 
值 的 次 数 所 占 的 比率 , 称 为 置信 水 平 (confidence level) 。 在 构造 置信 区 
间 时 ,可 以 用 所 希望 的 任意 值 作为 置信 水 平 。 比 较 常 用 的 置信 水 平 及 正 
态 分 布 曲线 下 右 侧 面积 为 a/2 时 的 < 值 (zs) 见 表 6-3. 

表 6-3 常用 置信 水 平 的 zw 


置信 水 平 /% a a/2 Za? 
90 0. 10 0. 05 1. 645 
95 0.05 0. 025 1.96 
99 0. 01 0. 005 2.58 


A K BA KE KRN : 


置信 区 间 - 
置信 水 平 =1-a 
| er | 
置信 下 限 置信 上 限 
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# 6. 4.2 评价 估计 量 的 标准 


对 于 同一 个 总 体 参 数 , 可 以 有 多 个 不 同 的 估计 方法 和 估计 量 。 例 如 ,要 估计 一 种 新 型 高 
效 节 能 灯泡 的 平均 使 用 寿命 ,可 以 随机 抽取 5 个 灯泡 作为 样本 ,进行 测试 后 得 到 下 列 数据 
(小 时 ) :4 900,4 950,5 100,5 260,5 340. 

那么 ,这 一 样本 的 样本 均值 为 =5 110 小 时 .样本 中 位 数 M.=5 100 小 时 。 此 时 ,我 们 
有 了 两 个 估计 量 :样本 均值 和 样本 中 位 数 ,究竟 应 该 选择 哪 一 个 作为 灯泡 总 体 平均 使 用 寿命 
的 估计 量 呢 ? 这 就 需要 有 评价 估计 量 优良 的 标准 。 一 般 地 说 ,一 个 好 的 估计 量 应 具备 三 个 
标准 ;无 偏 性 有 效 性 和 一 致 性 。 


E 无 偏 性 


无 偏 性 是 指 估计 量 抽样 分 布 的 数学 期 望 等 于 总 体 参 数 的 真 值 。 假 定 总 体 参数 为 9, 为 它 
的 估计 量 , 如 果 EO) =0, WR ONO 的 无 偏 估计 量 。 无 偏 性 的 含义 是 指 ,是 一 个 随机 变 
量 , 由 估计 量 算出 的 估计 值 有 时 可 能 偏 高 ,有 时 可 能 偏 低 , 但 这 些 估计 值 的 
平均 值 等 于 总 体 参数 的 真 值 。 在 平均 意义 下 ,无 偏 性 表示 没有 系统 误差 。 

可 以 证 明 : 在 重复 抽样 的 条 件 下 ,样本 均值 z 是 总 体 均值 wx 的 无 偏 估 
计量 ;样本 方差 是 总 体 方差 的 1/n, 即 co4 二 o?/n。 注 意 ,样本 标准 差 不 是 总 
体 标准 差 的 无 偏 估计 量 。 

图 6-5 给 出 了 点 估计 无 偏 和 有 偏 的 情形 。 


6 的 抽样 分 布 6 的 抽样 分 布 
, | 偏差 一 | 
0 EO-0 = 0 o EÔ j 
人 无 偏 估计 量 (b) 有 偏 估计 量 


6-5 点 估计 无 偏 和 有 偏 的 例子 


B 有 效 性 


一 个 无 偏 的 估计 量 并 不 意味 着 它 就 非常 接近 被 估计 的 参数 , 它 还 必须 与 总 体 参 数 的 离散 
程度 比较 小 。 对 同一 总 体 参 数 的 两 个 无 偏 点 估计 量 , 离 散 程度 较 小 的 估计 量 相对 而 言 是 较为 


有 效 的 。 离 散 程度 是 用 方差 度量 的 ,假定 有 两 个 由 于 估计 总 体 参数 的 无 偏 估计 值 ,分 别 用 名 和 
名 表示 ,它们 的 抽样 分 布 的 方差 分 别 用 D(9) 和 DG) HAR. WRB, HITT EFS, BY DOA I< 


DG, ) ,就 称 和 是 比 名 更 有 效 的 一 个 估计 量 。 在 无 偏 条 件 下 ,估计 量 的 方差 越 小 ,估计 值 也 就 越 
有 效 。 
对 于 一 个 正 态 总 体式 一 N (wo /n), 从 中 抽取 一 个 容量 为 n 的 简单 随机 样本 ,可 以 证 
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明 : 样 本 均值 和 样本 中 位 数 M. 都 是 总 体 均值 的 
无 偏 佑 计量。 而 且 , 作 为 总 体 均值 的 无 偏 估计 量 , 样 
AREY (A x HORE ASP fi M. 更 加 有 效 , 如 图 6-6 
所 示 。 


Ẹ 一 致 性 


一 致 性 又 称 相合 性 ,是 指 随 着 样本 容量 的 增 大 ， 。 
估计 量 越 来 越 接 近 总 体 参数 的 真 值 。 在 说 明 抽 样 分 
布 的 性 质 时 。 给 出 了 样本 均值 的 抽样 分 布 的 标准 差 
为 os 二 o/Yn。 由 于 os 与 样本 容量 大 小 有 关 , 样 本 容量 越 大 ,os 的 值 就 越 小 ,大 样本 给 出 的 估 
计量 更 接近 总 体 均 值 w。 从 这 个 意义 上 说 ,样本 均值 是 总 体 均值 的 一 个 一 致 估计 量 。 如 果 
一 个 估计 量 是 一 致 估计 量 , 那 么 可 以 通过 增加 样本 容量 来 提高 估计 的 精度 和 可 靠 性 。 可 以 
证 明 , 样 本 均值 二 是 总 体 均值 w 的 一 致 估计 量 ; 样 本 比例 五 是 总 体 比例 x 的 一 致 估计 量 ; 样 
本 方差 * 是 总 体 方差 oa 的 一 致 估计 量 ; 样 本 标准 差 ;是 总 体 标准 差 o 的 一 致 估计 量 。 


6.5 ”总体 均值 的 区 间 估 计 


在 对 总 体 均值 进行 区 间 估计 时 ,需要 考虑 总 体 是 否 为 正 态 分 布 ,总 体 方差 是 否 已 知 ,用 
于 构造 估计 量 的 样本 是 大 样本 还 是 小 样本 等 几 种 情况 。 


> 6.5.1 方差 已 知情 形 下 的 总 体 均 值 区 间 估 计 


当 总 体 服从 正 态 分 布 且 方 差 o* 已 知 ,或 者 非 正 态 总 体 但 抽样 是 大 样本 时 ,根据 中 心 极 
限定 理 和 样本 均值 的 抽样 分 布 的 性 质 可 知 , 样 本 均值 服从 于 正 态 分 布 。 数 学 期 望 为 总 
体 均 值 y, 方 差 为 o*/n。 而 样本 均值 经 过 标准 化 以 后 的 随机 变量 则 服从 标准 正 态 分 
布 , 即 : 


人 的 抽样 分 布 


和 的 抽样 分 布 


550 5 
图 6-6 两 个 无 偏 点 估计 值 的 抽样 分 布 


z=7 E N(0;1) 


a/Jn 
构造 的 总 体 均 值 p 的 置信 区 间 为 


T Za/2 


起 
in 
Zee ATF eae ÄER. 
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“是 预先 确定 的 一 个 概率 值 , 它 是 总 体 均值 不 包括 在 置信 区 间 的 概率 。 

= 后 是 估计 总 体 均值 时 的 边际 误差 \ 也 称 为 估计 误差 或 误差 范围 。 这 就 是 说 ,总 体 均 

n 

值 的 置信 区 间 由 两 部 分 组 成 :点 估计 值 和 描述 估计 量 精 度 的 误差 值 。 
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如 果 总 体 服 从 正 态 分 布 ,但 方差 AR FAL ,或 总 体 非 正 态 分 布 ,但 抽样 是 大 样本 ,那么 ,这 

时 的 总 体 均值 的 置信 区 间 可 写 为 
itea 

下 面 的 例子 讨论 了 总 体 标 准 差 已 知情 形 下 的 总 体 均值 的 区 间 估 计 。 

Mailing 公司 是 一 家 方便 食品 生产 商 , 以 袋 装 食品 为 主 , 每 天 的 产量 大 约 是 8 000 RAE 
右 。 按 规定 每 袋 的 重量 应 为 100 克 , 为 了 对 产品 质量 进行 监测 ,企业 质 检 部 门 经 常 进行 抽 
检 ,以 分 析 每 袋 重 量 是 否 符合 要 求 。 表 6-4 是 某 批 产 品 中 抽取 的 25 个 样本 数据 。 质 检 部 门 
关心 的 问题 是 这 批 产品 是 否 符合 包装 的 质量 要 求 。 


表 6-4 25 袋 食品 的 抽样 包装 重量 


112.5 | 101.0 | 103.0 | 102.0 | 100.5 | 102.6 | 107.5 | 95.0 | 108.8 | 115.6 | 100.0 | 123.5 | 102.0 


已 知 产品 重量 的 分 布 服从 正 态 分 布 , 且 总 体 标准 差 为 10 克 。 对 产品 的 抽样 均值 构造 一 
个 园 信 区 间 , 息 信 水 平 为 95% ,以 此 来 判断 产品 包装 是 否 符合 质量 要 求 。 
样本 均值 为 


由 o==10,n 二 25, 查 附录 表 1 标准 正 态 分 布 表 得 : 
2/2 (0.05)=1.96 
构造 置信 水 平 为 1 一 a 二 95% 的 苞 信 区 间 : 
二 
Mn 5 


因此 ,该 批 袋 装 食品 平均 重量 95% 的 管 信 区 间 为 101. 44 一 109. 28 克 。 


了 6. 5.2 方差 未 知情 形 下 的 总 体 均 值 区 间 估 计 


在 建立 总 体 均值 区 间 估 计时 ,我 们 通常 并 没有 关于 总 体 标准 差 的 一 个 好 估计 。 在 这 种 
情形 下 ,必须 利用 样本 估计 /和 ve 两 个 未 知 参数 。 当 利用 s 估计 o 时 ,边际 误差 和 总 体 均值 
的 区 间 佑 计 都 是 以 1 分布 的 概率 分 布 为 依据 进行 的 。 虽然 1 分布 的 数学 推导 是 以 假设 抽样 
总 体 服从 正 态 分 布 为 依据 的 ,但 是 研究 表明 ,在 许多 总 体 分 布 显 著 偏离 正 态 分 布 的 情形 下 ， 
利用 上 分 布 的 效果 还 是 相当 不 错 的 。 当 总 体 的 分 布 不 是 正 态 分 布 时 ,我们 给 出 了 利用 上 分 布 
的 准则 。 

1 分布 是 由 一 些 相似 的 概率 分 布 组 成 的 分 布 族 , 一 个 特定 的 上 分 布依 赖 于 被 称 为 自由 度 
(degrees of freedom) 的 参数 。 但 自由 度 分 别 为 1,2,3,… 时 ,有 且 仅 有 唯一 的 1 分 布 与 之 相 
对 应 ,t 分布 与 标准 正 态 分 布 之 间 的 差别 变 得 越 来 越 小 。 图 6-7 给 出 了 自由 度 分 别 为 10 和 
20 时 的 1 分 布 与 标准 正 态 分 布 的 关系 。 我 们 注意 到 , 随 着 自由 度 的 增 大 ,t 分 布 的 变量 幅度 
减 小 ,与 标准 正 态 分 布 也 越 来 越 相似 。 我 们 还 注意 到 ,t 分 布 的 均值 为 0。 

在 c 未 知 的 情形 下 ,为 了 计算 总 体 均 值 w 的 区 间 估 计 , 用 样本 估计 c ,用 :分 布 tuz 的 值 


—o 


=(101. 44,109. 28) 
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一 一 一 标准 正 态 分 布 
opti (自由 度 为 10) 
ort (自由 度 为 20) 


0 
图 6-7 自由 度 为 10 和 20 的 上 分 布 与 标准 正 态 分 布 的 比较 


代替 xz 。 于 是 ,边际 误差 为 tjss/Yn。 利 用 边际 误差 , 当 o 未 知 时 ,总 体 均值 区 间 估 计 公 式 
如 下 : 
二 二 
由 于 用 * 作为 总 体 标准 差 o 的 估计 值 ,因此 在 总 体 均值 区 间 估 计 中 与 上 值 相 对 应 的 自由 
度 为 n 一 1, 样 本 标准 差 的 计算 公式 为 


在 下 面 的 例子 中 ,我 们 在 小 样本 情形 下 考虑 如 何 建立 总 体 均值 的 区 间 估计 。 

KONI 公 司 正在 考虑 使 用 一 种 新 型 的 计算 机 辅助 软件 来 培训 设备 维修 员 。 为 了 对 
这 种 软件 有 一 个 全 面 的 评估 ,生产 负责 人 要 求 维修 员 完成 该 计算 机 辅助 培训 所 需要 的 
总 体 均值 进行 估计 。 选 取 了 20 名 维修 员 组 成 一 个 小 样本 ,样本 中 的 每 一 个 员工 都 完成 
培训 计划 。 每 人 所 需 的 培训 时 间 见 表 6-5。 图 6-8 是 样本 数据 的 直方 图 。 根据 直方 图 ， 
总 体 的 分 布 是 怎么 样 的 呢 ? 首先 ,样本 数据 不 能 支持 我 们 做 出 总 体 服 从 正 态 分 布 的 结 
论 ,但 是 ,我 们 也 没有 发 现任 何 偏 斜 或 者 异常 值 方面 的 证 据 。 因 此 ,根据 上 述 讨论 的 提 
IR ,我 们 的 结论 是 ,对 于 这 20 名 员工 组 成 的 样本 ,以 上 分 布 为 依据 进行 区 间 估 计 似 乎 是 
可 以 接受 的 。 

表 6-5 20 名 员工 样本 培训 时 间 
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> 6.6.1 假设 检验 一 般 问 题 


用 1. 假设 检验 的 基本 思想 


先 通过 一 个 例子 来 说 明 假设 检验 的 基本 思想 。 

某 企业 生产 一 种 零件 ,过 去 的 大 量 资料 表明 ,零件 的 平均 长 度 为 4 厘米 ,标准 差 为 0.1 
厘米 。 改 革 工 艺 后 ,抽查 了 100 个 零件 , 测 得 样本 平均 长 度 为 3. 94 厘米 。 那 么 ,工艺 改革 前 
后 零件 的 长 度 是 否 发 生 了 显著 的 变化 ? 

这 是 关于 工艺 改革 前 后 零件 的 平均 长 度 (总 体 平均 数 ) 是 否 等 于 4 厘米 的 检验 问题 。 我 
们 知道 ,样本 平均 长 度 与 原平 均 长 度 出 现 差 异 不 外 乎 两 种 可 能 : 

一 是 改革 后 的 总 体 平均 长 度 不 变 , 但 由 于 抽样 的 随机 性 使 样本 平均 数 与 总 体 平 均 数 之 
间 存 在 抽样 误差 。 

二 是 由 于 工艺 条 件 的 变化 ,使 总 体 平均 数 发 生 了 显著 的 变化 。 
因此 可 以 这 样 推断 :如 果 样 本 平均 数 与 总 体 平均 数 之 间 的 差异 不 大 ,未 超出 抽样 误差 范 
围 , 则 认为 总 体 平均 数 不 变 ;反之 ,如 果 样 本 平均 数 与 总 体 平均 数 之 间 的 差异 超出 了 抽样 误 
差 范 围 , 则 认为 总 体 平均 数 发 生 了 显著 的 变化 。 

由 上 面 例子 可 以 看 出 ,假设 检验 是 对 调查 人 员 所 关心 的 却 又 是 未 知 的 总 体 参 数 先 做 出 
假设 ,然后 抽取 样本 ,利用 样本 提供 的 信息 对 假设 的 正确 性 进行 判断 的 过 程 。 


B 假设 检验 的 步骤 


(1) 提出 原 假设 和 备 择 假设 。 对 每 个 假设 检验 问题 ,一 般 可 同时 提出 两 个 相反 的 假设 ， 
原 假设 和 备 择 假设 。 原 假设 又 称 零 假 设 , 是 正 待 检验 的 假设 , 记 为 H,; 备 择 假设 是 拒绝 原 假 
设 后 可 供 选 择 的 假设 , 记 为 也 。 原 假设 和 备 择 假设 是 相互 对 立 的 ,检验 结果 二 者 必 取 其 一 。 
接受 HH, 则 必须 拒绝 H ;反之 ,拒绝 有 H, 则 必须 接受 Hi 。 

原 假设 和 备 择 假设 不 是 随意 提出 的 ,应 根据 所 检验 问题 的 具体 背景 而 定 。 常 常 是 采取 
“不 轻易 拒绝 原 假设 ”的 原则 , 即 把 没有 充分 理由 则 不 能 轻易 否定 的 命题 作为 原 假设 ,而 相应 
地 把 没有 足够 把 握 就 不 能 轻易 肯定 的 命题 作为 备 择 假设 。 

一 般 地 ,假设 有 三 种 形式 : 

D Ho:p 二 pw; Hi:p 关 1o。 这 种 形式 的 假设 检验 称 为 双 侧 检验 。 

© Horp=pos Hi :y<po CR Ho repos Hi:y 二 po)。 这 种 形式 的 假设 检验 称 为 左 侧 
检验 。 

图 Ho:u= p; Wisp > po (或 Ho:y 二 pw; Hi :wx>m)。 这 种 形式 的 假设 检验 称 为 右 侧 

左 侧 检验 和 右 侧 检验 统称 为 单 侧 检验 。 采 用 哪 种 假设 ,要 根据 所 研究 的 实际 问题 而 定 。 
如 果 对 所 研究 问题 只 需 判断 有 无 显著 差异 或 要 求 同 时 注意 总 体 参数 偏 大 或 偏 小 的 情况 , 则 
采用 双 侧 检验 。 如 果 所 关心 的 是 总 体 参数 是 否 比 某 个 值 偏 大 (或 偏 小 ) , 则 宜 采 用 单 侧 检验 。 
在 本 节 讨 论 的 例子 中 ,如 果 我 们 在 乎 的 是 零件 长 度 是 否 比 原来 有 所 缩短 , 则 可 采用 单 侧 检 
验 , 即 Ho :y= 二 4 厘米 (或 uy 宇 4 EX); H :wxw<4 厘米 。 
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(2) 选择 适当 的 统计 量 ,并 确定 其 分 布 形式 。 在 参数 的 假设 检验 中 ,如 同 在 参数 估计 中 
一 样 ,要 借助 于 样本 统计 量 进行 统计 推断 。 用 于 假设 检验 问题 的 统计 量 称 为 检验 统计 量 。 
在 具体 问题 里 ,选择 什么 统计 量 作为 检验 统计 量 , 需 要 考虑 的 因素 与 参数 估计 相同 。 例 如 ， 
用 于 进行 检验 的 样本 是 大 样本 还 是 小 样本 ,总 体 方差 已 知 还 是 未 知 ,等 等 。 在 不 同 的 条 件 下 

应 选择 不 同 的 检验 统计 量 。 

(3) 选择 显著 性 水 平 ,确定 临界 值 。 显 著 性 水 平 表示 Ho 为 真 时 拒绝 瓦 ;的 概率 。 假 设 
检验 是 围绕 对 水 平 假设 内 容 的 审定 而 展开 的 。 如 果 原 假设 正确 且 我 们 接受 了 (同时 也 就 拒 
绝 了 替换 假设 ) ,或 原 假设 错误 且 我 们 拒绝 了 (同时 也 就 接受 了 替换 假设 ) ,这 表明 我 们 做 出 
了 正确 的 决定 。 但 是 ,由 于 假设 检验 是 根据 样本 提供 的 信息 进行 推断 的 ,也 就 有 犯错 误 的 可 
能 。 有 这 样 一 种 情况 , 原 假设 正确 ,而 我 们 却 把 它 当 成 错误 的 加 以 拒绝 。 犯 这 种 错误 的 概率 
用 a 表示 ,统计 上 把 a 称 为 假设 检验 中 的 显著 性 水 平 (significant level) ,也 就 是 决策 中 所 面 
临 的 风险 。 所 以 ,显著 性 水 平 是 指 当 原 假设 为 正确 时 人 们 却 把 它 拒绝 了 的 概率 或 风险 。 这 
个 概率 是 由 人 们 确定 的 ,通常 取 a=0.05 或 a=0.01, 这 表明 ,当做 出 接受 原 假设 的 决定 时 ， 
其 正确 的 可 能 性 (概率 ) 为 95% 或 99%。 即 拒绝 原 假 设 所 冒 的 风险 ,用 a 表示。 假设 检验 应 
用 小 概率 事件 实际 极 少 发 生 的 原理 ,这 里 的 小 概率 就 是 指 a。 给 定 了 显著 性 水 平 a ,就 可 由 
有 关 的 概率 分 布 表 查 得 临界 值 , 从 而 确定 Ho 的 接受 区 域 和 拒绝 区 域 。 临 界 值 就 是 接受 区 域 
和 拒绝 区 域 的 分 界 点 。 

对 于 不 同形 式 的 假设 , 本 的 接受 区 域 和 拒绝 区 域 也 有 所 不 同 。 双 侧 检验 的 拒绝 区 域 位 
于 统计 量 分 布 曲线 的 两 侧 ; 左 侧 检验 的 拒绝 区 域 位 于 统计 量 分 布 曲线 的 左 侧 ; 右 侧 检验 的 拒 

绝 区 域 位 于 统计 量 分 布 曲线 的 右 侧 ,如 图 6-9 所 示 。 


de of N 


拒绝 区 一 | 一 一 接受 区 一 | 一 拒绝 区 拒绝 区 一 | 
临界 值 临界 值 临界 值 
(a) 双全 检验 (b) 左 侧 检验 


接受 区 一 一 -一 拒绝 区 
临界 值 
(c) 右 侧 检验 


6-9 假设 检验 的 接受 区 域 和 拒绝 区 域 


(4) 做 出 结论 。 根 据 样本 资料 计算 出 检验 统计 量 的 具体 值 ,并 用 于 与 临界 值 比较 ,做 出 
接受 或 拒绝 原 假设 厅 , 的 结论 。 如 果 检 验 统计 量 的 值 落 在 拒绝 区 域内 ,说 明 样本 所 描述 的 情 
况 与 原 假设 有 显著 性 差异 ,应 拒绝 原 假设 ;反之 , 则 接受 原 假设 。 
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| 3. 假设 检验 的 小 概率 原理 


假设 检验 的 基本 思想 是 应 用 小 概率 的 原理 。 所 谓 小 概率 原理 ,是 指 发 生 概率 很 小 的 
随机 事件 在 一 次 实验 中 是 几乎 不 可 能 发 生 的 。 根 据 这 一 原理 ,可 以 做 出 是 否 接受 原 假设 
的 决定 。 例 如 ,有 一 个 厂商 声称 其 产品 的 合格 率 很 高 ,可 以 达到 99 % ,那么 从 一 批 产品 
(如 100 件 ) 中 随机 抽取 1 件 , 这 一 件 恰好 是 次 品 的 概率 就 非常 小 ,只 有 1%。 如 果 厂 商 的 
宣称 是 真 的 ,随机 抽取 1 件 是 次 品 的 情况 就 几乎 是 不 可 能 发 生 的 。 但 如 果 这 种 情况 确实 
发 生 了 ,我 们 就 有 理由 怀疑 原来 的 假设 , 即 产 品 中 只 有 1% 次 品 的 假设 是 否 成 立 , 这 时 就 
可 以 推翻 原来 的 假设 ,可 以 做 出 厂商 的 宣称 是 假 的 这 样 一 个 推断 。 我 们 进行 推断 的 依据 
就 是 小 概率 原理 。 当 然 ,推断 也 可 能 会 犯错 误 , 即 这 100 件 产品 中 确实 只 有 1 件 是 次 品 ， 
而 恰好 在 一 次 抽取 中 被 抽 到 了 。 所 以 这 个 例子 中 犯 这 种 错误 的 概率 是 1% ,也 就 是 说 我 
们 在 冒 1% 的 风险 做 出 厂商 宣称 是 假 的 这 样 一 个 推断 。 由 此 也 可 以 看 出 ,这 里 的 1% 正 是 
前 面 所 说 的 显著 性 水 平 。 


> 6.6.2 总 体 均值 .比例 的 假设 检验 


a! 


E 总 体 方差 已 知 时 对 正 态 总 体 均值 的 假设 检验 


设 总 体 X~N(usa2) ,总 体 方差 o? 为 已 知 ,Czivza zs) 为 总 体 的 一 个 样本 ,样本 平均 
数 为 去 。 现 在 的 问题 是 对 总 体 均值 /进行 假设 检验 。Hu y= po OR y< po >p) o 

根据 抽样 分 布 定理 ,样本 平均 数 王 服从 Geo? /n) ,所 以 ,如 果 瑟 成 立时 ,检验 统计 量 
U 及 其 分 布 为 : 


U= ~N(0,1) 
o/Vn 

利用 服从 正 态 分 布 的 统计 量 U 进行 的 假设 检验 称 为 U 检验 法 。 根 据 已 知 的 总 体 方差 、 
样本 容量 n 和 样本 平均 数 三 ,计算 出 检验 统计 量 U 的 值 。 对 于 给 定 的 检验 水 平 , 查 正 态 分 布 
表 可 得 临界 值 , 将 所 计算 的 U 值 与 临界 值 比较 , 便 可 做 出 检验 结论 。 

假定 某 厂 生产 的 产品 的 使 用 寿命 服从 正 态 分 布 N(1 020.100?)。 现 从 最 近 生 产 的 一 批 
产品 中 随机 抽取 16 件 , 测 得 样本 平均 寿命 为 1 080 小 时 。 试 在 0. 05 的 显著 性 水 平 下 判断 这 
批 产品 的 使 用 寿命 是 否 有 显著 提高 ? 

根据 题 意 ,提出 假设 : 


Ho: y=1 020; Hi :p>1 020 
检验 统计 量 : 


pata 1 080-1 020 _ 
a/n 100/ V16 
由 a 二 0.05, 查 表 得 临界 值 Uo os =1. 645. 
由 于 U=2.4 记 U, 二 1.645, 因 此 应 拒绝 Ho 而 接受 Hi , 即 这 批 产 品 的 使 用 寿命 确 有 显著 


提高 。 
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E 总 体 方差 未 知 时 对 正 态 总 体 均值 的 假设 检验 


设 总 体 和 一 N(j,o?/n), 但 总体 方差 o? 未 知 ,此 时 对 总 体 均值 的 检验 不 能 用 上 述 U 检验 
法 ,因为 此 时 的 检验 统计 量 U 中 包含 了 未 知 参数 c?。 为 了 得 到 一 个 不 含 未 知 参 数 的 检验 统 
计量 ,很 自然 会 用 总 体 方差 的 无 偏 估 计量 一 一 样本 方差 来 代替 o? ,于 是 得 到 了 统计 量 。 
根据 上 节 内 容 已 知道 ,检验 统计 量 T 及 其 分 布 为 
2 
利用 服从 : 分 布 的 统计 量 去 检验 总 体 均 值 的 方法 称 为 了 检验 法 。 其 具体 做 法 是 :根据 
题 意 提出 假设 (与 U 检验 法 中 的 假设 形式 相同 ) ;构造 检验 统计 量 T 并 根据 样本 信息 计算 其 
具体 值 ; 对 于 给 定 的 检验 水 平 ,由 上 分布 表 查 得 临界 值 ; 将 所 计算 的 上 值 与 临界 值 比较 ,做 出 
检验 结论 。 
双 侧 检验 时 , 若 T>taz , 则 拒绝 Ho ,接受 Hi. 


一 


左 侧 检验 时 , 若 tw, 则 拒绝 Hy ,接受 H,。 m 
右 侧 检验 时 , 若 TS tye , 则 拒绝 Hy ,接受 H. 
假定 某 厂 生产 的 某 种 电子 元 件 服从 均值 为 200 小 时 ,标准 差 未 知 
的 正 态 分 布 。 通 过 改变 部 分 生产 工艺 后 , 抽 得 10 件 做 样本 得 数据 (小 ero 


时 ) : 
202,209,213,198,206,210,195,208,200,207 
检验 目的 是 考察 电子 元 件 的 平均 值 数据 是 否 有 所 提高 。 因 此 ,可 建立 如 下 假设 : 
Hy :4=200; Hy :p>200 
根据 已 知 数据 求 得 
z=204.8, S=5.789 


_ 元 一 内 204.8 一 200_， 
S/ 5.789/VI0 
由 a=0. 05, 查 表 得 临界 值 上 (zx 一 1) 一 ts(10 一 1) 一 1.833 1 。 
HF | T| =2. 622>¢,(n—1) = 1. 833 1, 因 此 拒绝 Hy ESE Hi, 即 可 以 接受 “在 新 工艺 
下 ,这 种 电子 元 件 的 平均 值 有 所 提高 的 假设 ”。 
人 检验 法 适用 于 小 样本 情况 下 总 体 方差 未 知 时 对 正 态 总 体 均 值 的 假设 检验 。 随 着 样 
本 容量 的 增 大 沽 分 布 趋 近 于 标准 正 态 分 布 。 所 以 大 样本 情况 下 (" 二 30) ,总 体 方差 未 知 
时 对 正 态 总 体 均 值 y 的 假设 检验 通常 近似 采用 U 检验 法 。 同 理 . 大 样 
本 情况 下 非 正 态 总 体 均值 的 检验 也 可 用 UU 检验 法 。 因 为 ,根据 大 样本 
的 抽样 分 布 定理 ,总 体 分 布 形 式 不 明 或 为 非 正 态 总 体 时 ,样本 平均 数 趋 
近 于 正 态 分 布 。 这 时 ,检验 统计 量 U 中 的 总 体 标准 差 = 用 样本 标准 差 
SHR 


3. 总 体 比例 的 假设 检验 
由 比例 的 抽样 分 布 定理 可 知 ,样本 比例 服从 二 项 分 布 ,因此 可 由 二 项 分 布 来 确定 对 总 


一 一 化 
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体 比例 进行 假设 检验 的 临界 值 .但 其 计算 往往 十 分 烦琐 。 大 样本 情况 下 ,二 项 分 布 近似 服 
从 正 态 分 布 。 因 此 ,对 总 体 比例 的 检验 通常 是 在 大 样本 条 件 下 进行 的 ,根据 正 态 分 布 来 近 
似 确定 临界 值 , 即 采用 U 检验 法 。 其 检验 步骤 与 均值 检验 时 的 步骤 相同 ,只 是 检验 统计 
量 不 同 。 
首先 提出 待 检 验 的 假设 : 
Ho :P=Po;Hi:P 隐 Po( 或 P<Po,P>Po) 


检验 统计 量 为 : 
g=- Es -Ni 
pap) 
假定 在 检查 某 企 业 的 主要 生产 线 时 ,被 告知 性 能 良好 生产 稳定 ,产品 合格 率 可 达 99% 。 


随机 抽查 了 200 件 产品 ,其 中 195 件 产品 合格 ,判断 厂 方 的 宣称 是 否 可 信 ? (a 二 10%) 
可 建立 如 下 假设 : 
Ho: P=0. 99; H, :PA0. 99 


样本 比例 ， 
_m_195 = 
P= = 900 0: 975 
由 于 样本 容量 相当 大 ,因此 可 近似 采用 U 检验 法 。 
ü= p—Po _ 0.975—0.99 _ 1. 359 
pa-p) Ha 
J n 200 


给 定 a=0. 1, 查 正 态 分 布 表 得 pa = poos =1. 645. 
由 于 |U| 去 po ,应 接受 原 假 设 , 即 认为 厂 方 的 宣称 是 可 信和 的。 


PAN 
Excel 在 区 间 估 计 和 假设 检验 中 的 应 用 示例 


—,CONFIDENCE (Pt fi & [il] ) PBK 

CONFIDENCE (alpha. standard-dev. size) 

Alpha( il a) 是 用 于 计算 置信 和 度 的 显著 水 平 参 数 。 和 置信 和 度 等 于 (1 一 a). 亦 即 ,如 果 a 为 
0.05, 则 置信 度 为 0. 95。 

Standard-dev 数据 区 域 的 总 体 标准 差 , 假 设 为 已 知 (实际 中 ,总 体 标准 差 未 知 时 通常 用 
样本 标准 差 代替 )。 

Size 样本 容量 ( 即 n). 

如 果 假 设 a 等 于 0.05, 则 需要 计算 标准 正 态 分 布 曲线 (1 一 a 二 0.95) 之 下 的 临界 值 , 查 表 
知 其 临界 值 为 土 1. 96。 因此 置信 区 间 为 +1.96[ 全] 

假定 对 某 厂 一 批 产品 的 质量 进行 抽样 检验 为 例 , 抽 样 数据 和 要 求 如 下 :采用 重复 抽样 
抽取 样品 200 只 ,样本 优质 品 率 为 85%, 试 计算 当 把 握 程度 为 90% 时 优质 品 率 的 允许 
误差 。 
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在 Excel 表格 中 分 别 在 : 

B1 单元 格 中 输入 样本 容量 200; 

B2 单元 格 中 输入 样本 比率 85% ; 

在 B3 单元 格 中 输入 计算 样本 比率 的 标准 差 公式 “二 SQRT(B2X (1 一 B))”; 
在 B4 单元 格 输入 a 为 10%; 


在 BS 单元 格 中 输入 表达 式 :CONFIDENCE(B4,B3,B1), 即 得 到 Zuz | 全 一人 等 


于 4.15%。 
CONFIDENCE 函数 的 应 用 如 图 6-10 和 图 6-11 所 示 。 


样本 容量 n | 
样本 比率 p | | 
jema JOD (0. 357071, 
10% 
0.041531, 


|= =CONFIDENCE (B4, B3, B1) 


Emalmeae | 


图 6-11 CONFIDENCE 函数 的 应 用 (二 ) 


二 ,方差 未 知 时 一 个 总 体 均值 的 :检验 

将 6. 6.2 节 2 的 例子 中 的 10 个 样本 资料 分 别 输入 到 B1:B10 单元 格 中 。 

在 单元 格 B11 中 键入 公式 “二 AVERAGE(B1:B10)” 并 回 车 得 到 均值 ; 

在 单元 格 B12 中 键入 公式 “二 STDEV(B1:B10)” 并 回 车 得 到 标准 差 ; 

在 单元 格 B13 中 键入 公式 “二 COUNT(B1:B10)” 并 回 车 得 到 样本 数 ; 

在 单元 格 B14 中 键入 公式 “二 (B11 一 200)/(B12/SQRT(B13))” 并 回 车 得 到 + 值 ,其 中 


项 目 6 ”抽样 与 参数 估计 il 


200 是 题目 中 给 出 的 总 体 均 值 ; 

在 单元 格 B15 中 键入 公式 “二 TINV (0. 05, B13 一 1)” 得 到 a 二 0.05, 自 由 度 =9 的 临 
界 值 。 

从 图 6-12 的 结果 来 看 ,在 自由 度 为 9 时 ,1(2. 62)>to.os (2. 26) ,因此 ,拒绝 Hy MDE HEA 
“在 新 工艺 下 ,这 种 电子 元 件 的 平均 值 有 所 提高 ”的 假设 。 


|S) 文件 @) TS ROW BAO 格式 @) TAG BO) BOW) Ho 
ise ees aes ee Ju 24 | dy RE 


202 
209 
213 
198 
206 
210 
195 
208 
200 
207 
"—average(B 1:B 10)" 204.3 KA 
"=stdev(B 1B 10)" 5. 788878 标准 差 
"=count(B1B 10)" 10 样本 数 
"=B 11-200 12/sqrt(B13))" ”2.622085 THA 
15 |'=tinv(0.05,9) Cnst 


A 6-12 上 检 验 


ae 


本 项 目 我 们 主要 讨论 了 抽样 和 抽样 分 布 的 概念 ,说 明了 如 何 从 有 限 总 体 抽取 一 
简单 随机 样本 和 如 何 从 无 限 总 体 中 抽取 一 个 简单 随机 样本 。 利 用 收集 的 数据 对 总 体 参 
数 进行 点 估计 和 区 间 估 计 。 由 不 同 的 样本 统计 量 给 出 了 不 同 的 点 估计 值 。 比 如 总 体 均 
值 和 样本 均值 的 关系 ,总 体 方差 和 样本 方差 的 关系 等 。 我 们 知道 这 些 统计 量 都 是 随机 
变量 ,这 样 一 个 随机 变量 的 概率 分 布 叫 作 抽样 分 布 。 具 体 地 ,我们 描述 了 样本 均值 工 的 
抽样 分 布 。 在 讨论 的 抽样 分 布 特征 时 ,我 们 证 明了 样本 均值 的 数学 期 望 ECz) 等 于 总 
体 均值 w。 

本 项 目 还 给 出 了 总 体 均值 进行 区 间 估 计 的 方法 。 点 估计 值 可 能 是 也 可 能 不 是 总 体 参数 
的 好 估计 。 利 用 区 间 估 计 可 以 对 估计 的 精确 程度 予以 度量 。 总 体 均值 的 区 间 估 计 采 用 了 以 
下 形式 :点 估计 值 士 边际 误差 。 我 们 分 别 介绍 了 总 体 均值 估计 的 两 种 情形 。 在 o 已 知情 形 
下 ,服从 正 态 分 布 的 样本 统计 量 可 以 对 总 体 分 布 特征 进行 较为 精确 的 估计 。 在 未知 情形 
下 ,利用 小 样本 数据 的 标准 差 * 对 总 体 进 行 区 间 估 计时 ,使 用 上 分 布 对 总 体 进行 区 间 估 计 。 
样本 容量 越 大 ,这 个 区 间 估 计 的 近似 程度 越 好 。 在 区 间 估 计时 ,我 们 还 介绍 了 置信 区 间 、 置 
信 水 平等 概念 ,以 此 来 判断 区 间 估 计 的 精确 程度 。 

假设 检验 是 一 种 统计 方法 , 它 利用 样本 数据 来 确定 是 否 拒绝 关于 总 体 参 数值 。 假 
设 是 关于 总 体 参 数 的 两 种 对 立 的 说 法 。 其 中 一 个 叫 原 假设 (Ho), 另 一 个 叫 备 择 假设 
CHi) ,并 根据 实际 应 用 给 出 了 假设 规则 。 当 假定 总 体 标准 差 已 知 时 ,总 体 均 值 的 假设 
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检验 过 程 以 标准 正 态 分 布 为 依据 ; 当 o 未知 时 ,我 们 用 样本 标准 差 s 估计 总 体 c, 假 设 检 
验 过 程 以 +t 分布 为 依据 。 在 这 两 种 情形 下 ,假设 检验 结果 的 质量 依赖 于 总 体 分 布 的 形 
式 及 样本 容量 。 如 果 总 体 服从 正 态 分 布 , 则 即使 在 小 样本 的 情形 下 ,这 两 种 假设 检验 方 
法 也 是 适用 的 。 在 对 总 体 比率 进行 假设 检验 时 ,假设 检验 程序 利用 的 检验 统计 量 以 标 
准 正 态 分 布 为 依据 。 


th 2 


1. 总 体 均 值 为 200, 标 准 差 为 50。 从 总 体 中 抽取 一 个 容量 为 n= 100 的 简单 随机 样本 ， 
并 利用 样本 均值 估计 总 体 均 值 。 

A) 工 的 数学 期 望 是 多 少 ? 

(2) 工 的 标准 差 是 多 少 ? 

(3) 试 求 工 的 抽样 分 布 。 

(4) 大 的 抽样 分 布 说 明了 什么 ? 

2. 假定 总 体 标准 差 c 王 25 ,计算 样本 容量 n=50,100,150,200 时 均值 的 体 标准 差 cz 。 
当 样 本 容量 增加 时 ,均值 的 标准 误差 如 何 变化 ? 

3. 汽车 保险 费 的 均值 为 每 年 939 元 ,假定 标准 差 o= 245 元 。 

A) 对 某 一 汽车 保险 政策 ,请 在 下 面 的 样本 容量 下 ,分 别 计算 简单 随机 样本 的 样本 均值 
和 总 体 均 值 士 25 元 以 内 的 概率 是 多 少 ? n=30,50,100,400, 

(2) 当 试 图 估计 总 体 均 值 时 ,大 样本 的 好 处 是 什么 ? 

4. 为 了 估计 一 个 有 4 000 名 雇员 的 总 体 平均 年 龄 ,抽取 40 名 雇员 组 成 一 个 简单 随机 
样本 。 

(1) 在 计算 均值 的 标准 偏差 时 ,是 否 要 用 有 限 总 体 修正 系数 ? 为 什么 ? 

(2) 假定 总 体 标准 差 o = 8. 2 年 ,分 别 使 用 有 限 总 体 修正 系数 和 不 用 有 限 总 体 修正 系数 
计算 标准 误差 。 当 n/N 二 0.05 时 ,忽略 有 限 总 体 修正 系数 的 合理 性 何在 ? 

5. 对 自由 度 为 16 的 t 分 布 , 求 下 列 区 域内 的 概率 。 

(1) 2.120 右 侧 ;(2) 1.337 左 侧 ; (3) — 1.746 左 侧 ;(4) 2.583 右 侧 ; (5) 一 2.120 一 
2.120;(6) —1. 746~1. 746. 

6. 下 面 的 样本 数据 来 自 一 个 正 态 总 体 :10、8、12、15、13、11、6、5。 

(1) 总 体 均 值 的 点 估计 值 是 多 少 ? 

(2) 总 体 标准 差 的 点 估 值 是 多 少 ? 

(3) 在 95% 的 置信 水 平 下 ,总 体 均值 估计 的 边际 误差 是 多 少 ? 

(4) 总 体 均 值 的 95% 的 置信 区 间 是 多 少 ? 

7. 研究 人 员 对 369 名 有 工作 的 父母 的 一 项 调查 表明 ,他 们 当中 有 200 名 承认 由 于 工作 
的 原因 使 得 他 们 与 子女 相处 的 时 间 太 少 了 。 
(1) 有 工作 的 父母 总 体 中 ,由 于 工作 原因 使 得 他 们 与 子女 相处 时 间 太 少 的 父母 占 总 体 
比率 的 点 估计 是 多 少 ? 

(2) 当 置 信和 水平 为 95% 时 ,边际 误差 为 多 少 ? 

(3) 有 工作 的 父母 总 体 中 ,由 于 工作 原因 使 得 他 们 与 子女 相处 时 间 太 少 的 父母 占 总 体 
比率 的 95% 的 区 间 估 计 是 多 少 ? 
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8. 某 市 50 岁 及 50 岁 以 上 人 口 有 9 200 万 ,他 们 占 整个 可 支配 收入 的 50% , 据 相 关机 构 
估计 ,这 一 年 龄 段 用 于 消费 支出 人 均 是 1 873 元 。 假 设 这 一 估计 的 样本 由 80 人 组 成 ,并 且 标 
准 差 为 550 元。 

(1) 当 和 置信 水 平 为 95% 时 的 边际 误差 是 多 少 ? 

(2) 这 一 年 龄 自用 于 消费 支出 均值 的 95% 的 置信 区 间 是 多 少 ? 

(3) 估计 50 岁 及 50 岁 以 上 人 消费 总 支出 是 多 少 ? 

(4) 如 果 这 一 年 龄 段 用 于 消费 支出 是 右 偏 的 ,那么 你 预计 消费 支出 的 中 位 数 是 大 于 还 
是 小 于 1 873 元 ? 


相关 与 回归 分 析 


项 目 7 ”相关 与 回归 分 析 上 


>>>| 实践 中 的 统计 


联盟 数据 系统 


在 飞速 发 展 的 客户 关系 管理 行业 中 ,联盟 数据 系统 (ADS) 可 为 顾客 提供 交易 代理 、 信 贷 
服务 和 营销 服务 等 一 系列 服务 。ADS 的 顾客 群集 中 在 零售 业 、 加 油 站 、 便 利 店 .交通 运输 四 
大 行业 。ADS 在 各 地 有 140 000 台 零 售 店 终端 机 ,每 年 处 理 超过 25 亿 宗 交易 业务 。ADS 代 
理 了 49 种 贴 有 零售 商标 签 的 服务 计划 ,差不多 有 7 200 万 消费 者 持 有 参加 计划 的 优惠 卡 , 这 
使 得 ADS 公司 在 信用 服务 行业 中 排名 前 列 。 

作为 营销 服务 的 手段 之 一 ,ADS 设计 了 直接 向 顾客 投递 宣传 品 的 促销 活动 。 由 于 它 的 
数据 库 储存 了 1 亿 多 名 顾客 消费 习惯 的 信息 ,因此 ADS 把 那些 最 有 可 能 的 顾客 作为 促销 目 
标 ,通过 直接 向 他 们 邮寄 宣传 品 达 到 获得 收益 的 目的 。 公 司 的 分 析 发 展 部 门 运用 回归 分 析 
方法 ,建立 了 能 度量 并 预测 顾客 对 促销 活动 反应 的 模型 。 一 些 回 归 模 型 预测 了 顾客 收 到 促 
销 品 后 购买 商品 的 概率 , 另 一 些 回归 模型 则 预测 了 这 些 顾客 购买 商品 所 花费 的 金额 。 

在 某 一 项 特定 的 促销 活动 中 ,零售 连锁 店 的 目标 是 吸引 新 顾客 。 为 了 预测 此 项 促销 活 
动 的 效果 ,ADS 的 分 析 师 从 顾客 信息 数据 库 中 选取 了 一 个 样本 ,向 样本 中 的 每 一 个 顾客 发 
放 了 促销 宣传 材料 ,然后 将 样本 顾客 对 此 项 活动 反馈 的 数据 收集 起 来 并 加 以 处 理 。 样 本 数 
据 不 但 包括 顾客 由 于 促销 活动 而 购买 商品 的 金额 ,而 且 还 包括 各 种 各 样 的 ,有 助 于 预测 销售 
额 的 顾客 特定 变量 。 顾 客 特定 变量 是 指 顾 客 在 过 去 39 个 月 里 从 相关 商店 中 购买 商品 的 总 
金额 ,该 变量 对 预测 顾客 购买 商品 的 金额 将 会 起 到 很 大 的 作用 。ADS 的 分 析 师 建立 了 一 个 
购买 商品 与 金额 之 间 关 系 的 估计 回归 方程 :二 26. 7 十 0. 002 05x, 

AYP FRAME SH LSB ce 代表 过 去 从 相关 商店 中 购买 商品 的 金额 。 

利用 这 一 方程 ,我 们 能 够 预测 出 :一 位 在 过 去 39 个 月 里 从 相关 商店 中 购买 了 10 000 元 
的 顾客 ,对 于 直接 向 其 邮寄 宣传 品 的 反应 将 是 消费 47. 20 元 。 

本 项 目 中 ,我们 将 学 习 如 何 分 析 各 个 变量 之 间 的 关系 和 建立 估计 的 回归 方程 。 例 如 ,一 
位 市 场 销 售 经 理 考 虑 了 投入 广告 费用 和 销售 收入 之 间 的 关系 后 , 才 有 可 能 尝试 去 预测 一 个 
给 定 水 平 的 广告 费用 ,能 带 来 多 少 销售 收入 。 相 关 与 回归 分 析 (correlation and regression) 
就 是 处 理 这 些 变量 之 间 关 系 的 一 种 统计 方法 。 通 过 相关 分 析 , 可 以 判断 两 个 或 两 个 以 上 的 
变量 之 间 是 否 存 在 相关 关系 ,相关 关系 的 方向 形态 及 相关 关系 的 密切 程度 。 利 用 回归 方程 
对 具有 相关 关系 现象 间 数 量变 化 的 规律 性 进行 测定 ,并 进一步 进行 估计 和 预测 。 现 在 ,相关 
与 回归 分 析 已 经 广泛 应 用 于 企业 管理 .商业 决策 .金融 分 析 等 许多 领域 。 


[7. 1 相关 分 析 1 相关 分 析 


> 7. 1.1 相关 分 析 的 概念 与 类 型 


E 相关 分 析 的 概念 


自然 界 的 各 种 现象 之 间 相 互联 系 、 相 互 制约 、 相 互 依存 , 某 些 现象 发 生变 化 时 , 另 一 现象 
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也 随 之 发 生变 化 。 比 如 ,商品 价格 的 变化 会 刺激 或 抑制 商品 销售 量 的 变化 ;劳动 力 素质 的 高 
低 会 影响 企业 的 效益 ;直接 材料 .直接 人 工 的 价格 变化 对 产品 销售 成 本 
有 直接 的 影响 ,居民 收入 的 高 低 会 影响 消费 需求 等 。 研 究 这 些 现 象 之 间 
的 依存 关系 , 找 出 它们 之 间 的 变化 规律 ,是 对 搜集 .整理 过 的 统计 数据 进 
行 数据 分 析 ,为 客观 .科学 的 统计 提供 依据 。 

现象 间 的 依存 关系 大 致 可 以 分 成 两 种 类 型 :一 类 是 函数 关系 , 另 一 
类 是 相关 关系 。 

简单 地 说 ,函数 关系 指 变量 之 间 是 一 种 严格 的 确定 性 的 依存 关系 。 表 现 为 某 一 现象 发 
生变 化 男 一 现象 也 随 之 发 生变 化 ,而 且 有 确定 的 值 与 之 相对 应 。 例 如 ,银行 的 一 年 期 存款 和 
率 为 年 息 1.98%, 存 人 的 本 金 用 xz 表示 ,到 期 本 息 用 y 表示 , 则 > 一 z 十 1. 98%z( 不 考虑 利息 
税 ) ;再 如 , 某 种 股票 的 成 交 额 Y 与 该 股票 的 成 交 量 X 、 成 交 价 格 P 之 间 的 关系 可 以 用 Y= 
PX 来 表示 ,这 都 是 函数 关系 。 

相关 关系 是 指 客观 现象 之 间 确 实 存 在 的 ,但 数量 上 不 是 严格 对 应 的 依存 关系 。 在 这 种 
关系 中 ,对 于 某 一 现象 的 每 一 数值 ,可 以 有 另 一 现象 的 若干 数值 与 之 相对 应 。 例 如 成 本 的 高 
低 与 利润 的 多 少 有 密切 关系 ,但 某 一 确定 的 成 本 与 相对 应 的 利润 却 是 不 确定 的 。 这 是 因为 
影响 利润 的 因素 除了 成 本 外 ,还 有 价格 、 供 求 关 系 、 消 费 喜好 等 因素 及 其 他 偶然 因素 的 影响 。 
再 如 ,生育 率 与 人 均 GDP 的 关系 也 属于 典型 的 相关 关系 :人 均 GDP 高 的 国家 ,生育 率 往往 
较 低 , 但 二 者 没有 唯一 确定 的 关系 ,这 是 因为 除了 经 济 因 素 外 .生育 水 平 还 受 教育 水 平城 市 
化 水 平 及 不 易 测 量 的 民族 风俗 .宗教 和 其 他 随机 因素 的 共同 影响 。 

具有 相关 关系 的 某 些 现 象 可 表现 为 因果 关系 , 即 某 一 或 若干 现象 的 变化 是 引起 另 一 现 
象 变 化 的 原因 , 它 是 可 以 控制 ,给 定 的 值 ,将 其 称 为 自 变量 ; 另 一 个 现象 的 变化 是 自 变 量变 化 
的 结果 , 它 是 不 确定 的 值 ,将 其 称 为 因 变 量 。 如 资金 投入 与 产值 之 间 , 前 者 为 自 变量 ,后 者 为 
因 变 量 。 但 具有 相关 关系 的 现象 并 不 都 表现 为 因果 关系 ,如 生产 费用 和 生产 量 、 商 品 的 供求 
与 价格 等 。 这 是 由 于 相关 关系 比 因果 关系 包括 的 范围 更 广泛 。 

相关 关系 和 函数 关系 既 有 区 别 , 又 有 联系 。 有 些 函 数 关 系 往往 因为 有 观察 或 测量 误差 
及 各 种 随机 因素 的 干扰 等 原因 ,在 实际 中 常常 通过 相关 关系 表现 出 来 ;而 在 研究 相关 关系 
时 ,对 其 数量 间 的 规律 性 了 解 得 越 深 刻 的 时 候 . 则 相关 关系 越 有 可 能 转化 为 函数 关系 或 借助 


B 相关 关系 的 类 型 


现象 之 间 的 相关 关系 从 不 同 的 角度 可 以 区 分 为 不 同类 型 。 

(1) 按照 相关 关系 涉及 变量 (或 因素 ) 的 多 少 分 为 : 

O 单 相 关 。 又 称 一 元 相关 ,是 指 两 个 变量 之 间 的 相关 关系 ,如 广告 费 支 出 与 产品 销售 
量 之 间 的 相关 关系 。 

O 复 相关 。 又 称 多 元 相关 ,是 指 三 个 或 三 个 以 上 变量 之 间 的 相关 关系 ,如 商品 销售 额 
与 居民 收入 .商品 价格 之 间 的 相关 关系 。 

@ 偏 相 关 。 在 一 个 变量 与 两 个 或 两 个 以 上 的 变量 相关 的 条 件 下 , 当 假 定 其 他 变量 不 变 
时 ,其 中 两 个 变量 的 相关 关系 称 为 偏 相关 。 例 如 ,在 假定 商品 价格 不 变 的 条 件 下 ,该 商品 的 
需求 量 与 消费 者 收入 水 平 的 相关 关系 即 为 偏 相 关 。 
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(2) 按照 相关 形式 不 同 分 为 : 

O 线性 相关 。 又 称 直线 相关 ,是 指 当 一 个 变量 变动 时 , 另 一 变量 随 之 发 生 大 致 均等 的 
变动 ,从 图 形 上 看 ,其 观察 点 的 分 布 近似 地 表现 为 一 条 直线 ;例如 ,人 均 消 费 水 平 与 人 均 收入 
水 平 通常 呈 线 性 关系 。 

@ 非 线性 相关 。 一 个 变量 变动 时 , 另 一 变量 也 随 之 发 生变 动 , 但 这 种 变动 不 是 均等 的 ， 
从 图 形 上 看 ,其 观察 点 的 分 布 近似 地 表现 为 一 条 曲线 ,如 抛物 线 、 指 数 曲线 等 ,因此 也 称 曲 线 
相关 。 例 如 ,工人 在 一 定数 量 界限 内 加 班 加 点 ,产量 增加 ,但 一 旦 超过 一 定 限度 ,产量 反而 可 
能 下 降 ,这 就 是 一 种 非 线性 关系 。 

(3) 按照 相关 现象 变化 的 方向 不 同 分 为 : 

O 正 相 关 。 当 一 个 变量 的 值 增加 或 减少 , 另 一 个 变量 的 值 也 随 之 增加 或 减少 。 如 工人 
劳动 生产 率 提高 ,产品 产量 也 随 之 增加 ;居民 的 消费 水 平 随 个 人 所 支配 收入 的 增加 而 增加 。 

© 负 相 关 。 当 一 个 变量 的 值 增加 或 减少 时 , 另 一 变量 的 值 反而 减少 或 增加 。 如 商品 流 
转 额 越 大 ,商品 流通 费用 越 低 :利润 随 单 位 成 本 的 降低 而 增加 。 

(4) 按 相关 程度 分 为 : 

O 完全 相关 。 当 一 个 变量 的 数量 完全 由 另 一 个 变量 的 数量 变化 所 确定 时 ,二 者 之 间 即 
为 完全 相关 。 例 如 ,在 价格 不 变 的 条 件 下 ,销售 额 与 销售 量 之 间 的 正比 例 函 数 关系 即 为 完全 
相关 ,此 时 相关 关系 便 成 为 函数 关系 ,因此 也 可 以 说 函数 关系 是 相关 关系 的 一 个 特例 。 

© 不 相关 。 又 称 零 相关 , 当 变 量 之 间 彼 此 互 不 影响 ,其 数量 变化 各 自 独立 时 , 则 变量 之 
间 为 不 相关 。 例 如 ,股票 价格 的 高 低 与 气温 的 高 低 一 般 情况 下 是 不 相关 的 。 

@ 不 完全 相关 。 如 果 两 个 变量 的 关系 介 于 完全 相关 和 不 相关 之 间 , 称 为 不 完全 相关 。 
由 于 完全 相关 和 不 相关 的 数量 关系 是 确定 的 或 相互 独立 的 ,因此 统计 学 中 相关 分 析 的 主要 
研究 对 象 是 不 完全 相关 。 


P 7.1.2 相关 关系 的 测定 


要 判别 现象 之 间 有 无 相关 关系 ,一 是 定性 分 析 , 二 是 定量 分 析 。 

定性 分 析 是 依据 研究 者 的 理论 知识 ,专业 知识 和 实践 经 验 , 对 客观 现象 之 间 是 否 存在 相 
关 关 系 , 以 及 有 何 种 相关 关系 做 出 判断 。 并 可 在 定性 认识 的 基础 上 ,编制 相关 表 、 绘 制 相关 
图 ,以 便 直观 地 判断 现象 之 间 相关 的 方向 .形态 及 大 致 的 密切 程度 。 


E 相关 表 


相关 表 是 一 种 统计 表 。 它 是 直接 根据 现象 之 间 的 原始 资料 ,将 一 变量 的 若干 变量 值 按 
从 小 到 大 的 顺序 排列 ,并 将 另 一 变量 的 值 与 之 对 应 排列 形成 的 统计 表 。 

表 7-1 是 某 财 务 软 件 产品 的 广告 投入 与 销售 额 的 关系 ,统计 人 员 随 机 选择 10 家 代理 商 
进行 观察 ,搜集 到 年 广告 投入 费 和 月 平均 销售 额 的 数据 。 


表 7-1 广告 费 与 月 平均 销售 额 相关 表 单位 :万 元 
年 广告 费 投 入 月 均 销 售 额 年 广告 费 投 入 月 均 销售 额 
12.5 21.2 34.4 43.2 
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年 广告 费 投 入 月 均 销 售 额 年 广告 费 投 入 月 均 销 售 额 
15.3 23.9 39.4 49.0 
23,2 32.9 45.2 52.8 
26. 4 34.1 55. 4 59.4 
38.5 42.5 60. 9 63.5 


从 表 中 可 以 直观 地 看 出 , 随 着 广告 投入 的 增加 ,销售 量 增加 ,两 者 之 间 存 在 一 定 的 正 相 
E 散 点 图 


散 点 图 又 称 相关 图 , 它 是 用 直角 坐标 系 的 x 轴 代 表 自 变量 ,y 轴 代 表 因 变量 ,将 两 个 变 
量 间 相对 应 的 变量 值 用 坐标 点 的 形式 描绘 出 来 ,用 于 表明 相关 点 分 布 状况 的 图 形 。 根 据 表 
7-1 的 数据 绘制 相关 图 。 


75 上 


30 上 


10 20 30 40 30 60 70 
广告 费 投入 
图 7-1 广告 投入 与 销售 额 的 散 点 图 
从 散 点 图 可 以 直观 地 看 出 ,年 广告 费 投 入 与 月 平均 销售 额 之 间 相 关 密 切 , 且 有 线性 正 相 


相关 表 和 相关 图 可 反映 两 个 变量 之 间 的 相互 关系 及 其 相关 方向 ,但 
无 法 确切 地 表明 两 个 变量 之 间 相 关 的 程度 。 著 名 统计 学 家 卡尔 。 皮尔 
撑 设计 了 统计 指标 一 一 相关 系数 。 相 关系 数 是 用 以 反映 变量 之 间 相 关 
关系 密切 程度 的 统计 指标 。 相 关系 数 的 平方 称 为 判定 系数 。 

相关 系数 用 表示 , 它 的 公式 为 


nJ — I 
nD (Day Ahr- (Evy 
相关 系数 的 值 介 于 一 1 5H IKK HEMP: 
当 r>0 时 ,表示 两 变量 正 相 关 ;r<0 时 ,两 变量 为 负 相 关 。 
当 |r| 二 1 时 ,表示 两 变量 为 完全 线性 相关 , 即 为 函数 关系 。 
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4 r=0 时 ,表示 两 变量 间 无 线性 相关 关系 。 
当 0 过 |x| 过 1 时 ,表示 两 变量 存在 一 定 程度 的 线性 相关 。 且 |z| 越 接近 1, 两 变量 间 线 性 
关系 越 密切 ; |r| 越 接近 于 0, 表示 两 变量 的 线性 相关 越 弱 。 
一 般 可 按 三 级 划分 : |x| 二 0.4 为 低 度 线性 相关 ;0. 4<| | <0. 7 为 显著 性 相关 ;0. 7< 
|r| <1 为 高 度 线 性 相关 。 
根据 表 7-1 的 资料 ,可 计算 相关 系数 , 见 表 7-2。 
表 7-2 相关 系数 计算 表 


序号 工 广告 投入 y 销售 额 y zy 
1 12.5 21.2 156. 25 449. 44 265. 00 
3 15.3 23.9 234. 09 571.21 365. 67 
3 23.2 32.9 538. 24 1 082. 41 763. 28 
4 26.4 34.1 696. 96 1 162. 81 900. 24 
5 33.5 42.5 1 122. 25 1 806. 25 1 423. 75 
6 34.4 43.2 1 183. 36 1 866. 24 1 486. 08 
7 39.4 49.0 1 552. 36 2 401. 00 1 930. 60 
8 45.2 52.8 2 043. 04 2 787. 84 2 386. 56 
9 55.4 59.4 3 069. 16 3 528. 36 3 290. 76 
10 60. 9 63.5 3 708. 81 4 032. 25 3 867. 15 

合计 346. 2 422.5 14 304. 52 19 687. 81 16 679. 09 


n>) 一 Da DE y 
ee E A a) 
10 X 16 679. 09 — 346. 2 X 422. 5 
10 X 14 304. 52 — 346. 2? V10 X 19 687. 81 — 422. 5? 
= 0. 994 2 
相关 系数 为 0. 994 2 ,说 明 广告 投入 费 与 月 平均 销售 额 之 问 有 高 度 的 线性 正 相关 关系 。 
这 里 需要 指出 的 是 ,相关 系数 有 一 个 明显 的 缺点 , 即 它 接近 于 1 的 程度 与 数据 组 数 n 相 
关 , 这 容易 给 人 一 种 假象 。 因 为 , 当 较 小 时 ,相关 系数 的 波动 较 大 ,对 有 些 样 本 相关 系数 的 
绝对 值 易 接近 于 1; H n 较 大 时 ,相关 系数 的 绝对 值 容易 偏 小 。 特 别 是 当 n= 二 2 时 ,相关 系数 
的 绝对 值 总 为 1。 因 此 在 样本 容量 较 小 时 ,我 们 仅 赁 相关 系数 较 大 就 判定 变量 x 与 y 之 间 
有 密切 的 线性 关系 是 不 妥当 的 。 


b 7. 1.3 相关 分 析 中 应 注意 的 问题 


[i 相关 系数 不 能 解释 两 变量 问 的 因果 关系 


相关 系数 只 是 表明 两 个 变量 间 互 相 影 响 的 程度 和 方向 , 它 并 不 能 说 明 两 变量 间 是 否 有 
因果 关系 ,以 及 何 为 因 , 何 为 果 , 即 使 是 在 相关 系数 非常 大 时 ,也 并 不 意味 着 两 变量 间 具 有 显 
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著 的 因果 关系 。 例 如 ,根据 一 些 研究 ,发 现 抽烟 与 学 习 成 绩 有 负 相 关 关 系 ,但 不 能 由 此 推断 
是 抽烟 导致 了 成 绩 差 。 

因 与 果 在 很 多 情况 下 是 可 以 互 换 的 。 如 研究 发 现 收入 水 平 与 股票 
的 持 有 和 额 正 相 关 , 并 且 可 以 用 收入 水 平 作为 解释 股票 持 有 额 的 因素 ,但 
是 否 存在 这 样 的 情况 ,你 赚 的 钱 越 多 , 买 的 股票 也 越 多 ;而 买 的 股票 越 
多 , 赚 的 钱 也 就 越 多 。 何 为 因 ? 何 为 果 ? 众所周知 ,经 济 增长 与 人 口 增 
长 相关 ,可 是 究竟 是 经 济 增长 引起 人 口 增长 ,还 是 人 口 增长 引起 经 济 增 
长 呢 ? 不 能 从 相关 系数 中 得 出 结论 。 


由 >. 警惕 虚假 相关 导致 的 错误 结论 


有 时 两 变量 之 间 并 不 存在 相关 关系 ,但 却 可 能 出 现 较 高 的 相关 系数 。 

如 存在 另 一 个 共同 影响 两 变量 的 因素 。 在 时 间 序 列 资料 中 往往 就 会 出 现 这 种 情 
况 , 有 人 曾 对 教师 薪金 的 提高 和 酒 价 的 上 涨 作 了 相关 分 析 ,计算 得 到 一 个 较 大 的 相关 系 
数 , 这 是 否 表明 教师 薪金 提高 导致 酒 的 消费 量 增 加 ,从 而 导致 酒 价 上 涨 呢 ? 经 分 析 , 事 
实 是 由 于 经 济 繁荣 导致 教师 薪金 和 酒 价 的 上 涨 ,而 教师 薪金 增长 和 酒 价 之 间 并 没有 什 
么 直接 关系 。 

原因 的 混杂 也 可 能 导致 错误 的 结论 。 如 有 人 做 过 计算 ,发 现在 美国 经 济 学 学 位 越 高 的 
人 ,收入 越 低 , 笼 统 地 计算 学 位 与 收入 之 间 的 相关 系数 会 得 到 负 值 。 但 分 别 对 大 学 ,政府 机 
构 、 企 业 各 类 别 计算 学 位 与 收入 之 间 的 相关 系数 得 到 的 则 是 正 值 , 即 对 同一 行业 而 言 , 学 位 
高 ,收入 也 高 。 

男 外 ,注意 不 要 在 相关 关系 据 以 成 立 的 数据 范围 以 外 ,推论 这 种 相关 关系 仍然 保持 。 雨 
下 得 多 ,农作物 长 得 好 ,但 雨量 太 大 , 却 可 能 损坏 庄稼 。 又 如 ,广告 投入 多 ,销售 额 上 涨 ,利润 
增加 ,但 盲目 加 大 广告 投入 , 却 未 必 使 销售 额 再 增长 ,利润 还 可 能 减少 。 正 相关 达到 某 个 极 
限 , 就 可 能 变 成 负 相 关 。 这 个 道理 似乎 人 人 都 明白 ,但 在 分 析 问 题 时 却 容易 忽视 。 


[7. 2 一 元 线性 回归 分 析 


PP 7.2.1 回归 分 析 


“回归 ”一 词 是 由 英国 生物 学 家 F. Galton 在 研究 人 体 身 高 的 遗传 问 
题 时 首先 提出 的 。 根 据 遗 传 学 的 观点 , 子 辈 的 身高 受 父辈 影响 ,以 X 记 
父辈 身高 ,Y 记 子 辈 身高 。 虽 然 子 辈 身高 一 般 受 父辈 影响 ,但 同样 身高 
的 父亲 ,其 子 身高 并 不 一 致 ,因此 ,X 和 Y 之 间 存 在 一 种 相关 关系 。 一 般 
而 言 ,父辈 身高 者 ,其 子 辈 身 高 也 高 .以 此 推论 ,祖祖辈辈 遗传 下 来 ,身高 
必然 向 两 极 分 化 ,而 事实 上 并 非 如 此 ,显然 有 一 种 力量 将 身高 拉 向 中 心 , 即 子 辈 的 身高 有 向 
中 心 回归 的 特点 。“ 回 归 ” 一 词 即 源 于 此 。 虽 然 这 种 向 中 心 回归 的 现象 只 是 特定 领域 里 的 结 
论 ,并 不 具有 普遍 性 :但 从 它 所 描述 的 关于 X 为 自 变量 ,Y 为 不 确定 的 因 变 量 这 种 变量 间 的 
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关系 看 ,和 我 们 现在 的 回归 含义 是 相同 的 。 不 过 ,现代 回归 分 析 虽 然 沿用 了 “回归 ”一 词 ,但 
内 容 已 有 很 大 变化 , 它 是 一 种 应 用 于 许多 领域 的 广泛 的 分 析 研 究 方法 ,在 经 济 理论 研究 和 实 
证 研究 中 也 发 挥 着 重要 的 作用 。 

回归 分 析 通 过 一 个 变量 或 一 些 变量 的 变化 解释 另 一 变量 的 变化 。 其 主要 内 容 和 步骤 
是 ,首先 根据 理论 和 对 问题 的 分 析 判 断 , 将 变量 分 为 自 变 量 和 因 变 量 ; 其 次 ,设法 找 出 合适 的 
数学 方程 式 ( 即 回归 模型 ) 描 述 变量 间 的 关系 ;由 于 涉及 的 变量 具有 不 确定 性 ,接着 还 要 对 回 
归 模 型 进行 统计 检验 ;统计 检验 通过 后 ,最 后 是 利用 回归 模型 ,根据 自 变 量 去 估计 、 预 测 因 
变量 。 


E 


归 有 不 同 种 类 ,按照 自 变量 的 个 数 分 ,有 一 元 回归 和 多 元 回归 。 只 有 一 个 自 变量 的 称 
为 一 元 回归 ,有 两 个 或 两 个 以 上 自 变 量 的 称 为 多 元 回归 ;按照 回归 曲线 的 形态 分 ,有 线性 ( 直 
线 ) 回 归 和 非 线 性 (曲线 ) 回 归 。 实 际 分 析 时 应 根据 客观 现象 的 性 质 \ 特 点 ,研究 目的 和 任务 
选取 回归 分 析 的 方法 。 我 们 仅 讨 论 一 元 线性 回归 分 析 。 


P 7.2.2 相关 与 回归 分 析 的 关系 


相关 分 析 是 回归 分 析 的 基础 和 前 提 , 回 归 分 析 则 是 相关 分 析 的 深入 和 继续 。 相 关 分 析 
需要 依靠 回归 分 析 来 表现 变量 之 间 数 量 相关 的 具体 形式 ,而 回归 分 析 则 需要 依靠 相关 分 析 
来 表现 变量 之 间 数 量变 化 的 相关 程度 。 只 有 当 变 量 之 间 存 在 高 度 相 关 时 ,进行 回归 分 析 寻 
求 其 相关 的 具体 形式 才 有 意义 。 如 果 在 没有 对 变量 之 间 是 否 相关 及 相关 方向 和 程度 做 出 正 
确 判 断 之 前 ,就 进行 回归 分 析 , 很 容易 造成 “虚假 回归 ”。 与 此 同时 ,相关 分 析 只 研究 变量 之 
间 相关 的 方向 和 程度 ,不 能 推断 变量 之 间 相 互 关系 的 具体 形式 ,也 无 法 从 一 个 变量 的 变化 来 
推测 另 一 个 变量 的 变化 情况 ,因此 ,在 具体 应 用 过 程 中 ,只 有 把 相关 分 析 和 回归 分 析 结 合 
来 ,才能 达到 研究 和 分 析 的 目的 。 

二 者 的 区 别 主要 体现 在 以 下 三 个 方面 : 

(1) 在 相关 分 析 中 涉及 的 变量 不 存在 自 变 量 和 因 变 量 的 划分 问题 ,变量 之 间 的 关系 是 
对 等 的 ;而 在 回归 分 析 中 , 则 必须 根据 研究 对 象 的 性 质 和 研究 分 析 的 目的 ,对 变量 进行 自 变 
量 和 因 变 量 的 划分 。 因 此 ,在 回归 分 析 中 ,变量 之 间 的 关系 是 不 对 等 的 。 

(2) 在 相关 分 析 中 所 有 的 变量 都 必须 是 随机 变量 ;而 在 回归 分 析 中 , 自 变 量 是 给 定 的 ， 
因 变 量 才 是 随机 的 ,即将 自 变量 的 给 定 值 代入 回归 方程 后 ,所 得 到 的 因 变 量 的 估计 值 不 是 唯 
一 确定 的 ,而 会 表现 出 一 定 的 随机 波动 性 。 

(3) 相关 分 析 主 要 是 通过 一 个 指标 即 相关 系数 来 反映 变量 之 间 相 关 程 度 的 大 小 ,由 于 
变量 之 间 是 对 等 的 ,因此 相关 系数 是 唯一 确定 的 。 而 在 回归 分 析 中 ,对 于 互 为 因果 的 两 个 变 
量 (如 和 人 的 身高 与 体重 、 商 品 的 价格 与 需求 量 ), 有 可 能 存在 多 个 回归 方程 。 

需要 指出 的 是 ,变量 之 间 是 否 存 在 “真实 相关 ”, 是 由 变量 之 间 的 内 在 联系 所 决定 的 。 相 
关 分 析 和 回归 分 析 只 是 定量 分 析 的 手段 ,通过 相关 分 析 和 回归 分 析 , 虽 然 可 以 从 数量 上 反映 
变量 之 间 的 联系 形式 及 其 密切 程度 ,但 是 无 法 准确 判断 变量 之 间 内 在 联系 的 存在 与 否 ,也 无 
法 判断 变量 之 间 的 因果 关系 。 因 此 ,在 具体 应 用 过 程 中 ,一 定 要 始终 注意 把 定性 分 析 和 定量 
分 析 结 合 起 来 ,在 准确 的 定性 分 析 的 基础 上 展开 定量 分 析 。 
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7.3 估计 的 线性 回归 方程 


对 于 具有 线性 相关 关系 的 两 个 变量 ,由 于 有 随机 因素 的 干扰 ,两 变量 的 线性 关系 中 应 包 
括 随机 误差 项 e, 即 有 : 
y= +Brte (7-2) 
对 于 工 某 一 确定 的 值 , 其 对 应 的 y 值 虽 有 波动 ,但 随机 误差 的 期 望 值 为 零 , 即 E (e) 二 0， 
因而 从 平均 意义 上 说 ,是 一 个 期 望 值 , 记 y 为 E(y) ,总体 线 性 回归 方程 为 : 
y=E(y)=pB+Bzx c7-33 
我 们 可 通过 样本 观测 值 计算 By 、B ,用 它 对 (7-2) 式 中 的 参数 作出 估计 , 即 求 样本 回归 方 
程 ,用 它 对 总 体 线性 回归 方程 进行 估计 。 样 本 回归 直线 方程 又 称 一 元 线性 回归 方程 ,其 表达 
形式 为 : 
y=bo thx (7-4) 
式 中 ,y 表示 因 变 量 的 估计 值 (回归 理论 值 ) ;5 bi 是 待定 参数 ,其 中 bo 是 回归 直线 的 起 
始 值 ( 截 距 ), 即 zx 为 0 时 的 y 值 ,从 数学 意义 上 理解 , 它 表示 在 没有 自 变 量 x 的 影响 时 ,其 他 
各 种 因素 对 因 变 量 y 的 平均 影响 ;b 是 回归 系数 (直线 的 斜率 ) ,表示 自 变量 x 每 变动 一 个 单 
位 时 , 因 变 量 y 平均 变动 b 个 单位 。 
线性 回归 方程 中 的 待定 参数 是 根据 样本 数据 求 出 的 ,方法 是 最 小 二 乘法 。 
n dain — Dm Dy 
na? — (Day (7-5) 
bo = y— bI 


当 bo vb, 求 出 后 ,一 元 线性 回归 方程 y= bo Hb x 便 可 确定 。 


bi 


回归 模型 
y=, th xte 
回归 方程 
EQ)=B+B x 
未 知 参数 
By Bi 


估计 的 回归 方程 
SHB +x 


样本 统计 量 
by b 


oo Si 


图 7-2 线性 回归 的 估计 步骤 


下 面 的 例子 讨论 了 如 何 利 用 样本 数据 集 建 立 回归 方程 并 进行 预测 。 
MEIDI 电 器 有 限 公司 收集 了 2014 年 1 一 10 月 产量 与 制造 费用 数据 。 分 析 制 造 费用 对 
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= 


产量 之 间 的 数量 关系 。 首 先 ,我 们 假定 回归 方程 z 为 产量 ,y 为 制造 费用 。 计 算 过 程 见 表 
7-3. 


表 7-3 成 本 回归 分 析 计算 表 


月 份 工 产量 ( 件 ) | y 制造 费用 (元 ) y zy 
1 36 000 52 500 129 600 275 625 189 000 
2 40 500 54 300 164 025 294 849 219 915 
3 42 700 56 400 182 329 318 096 240 828 
4 45 800 61 500 209 764 378 225 281 670 
5 46 000 58 500 211 600 342 225 269 100 
6 48 500 61 300 235 225 375 769 297 305 
7 52 300 63 800 273 529 407 044 333 674 
8 54 000 66 000 291 600 435 600 356 400 
9 55 800 67 050 311 364 449 570. 3 374 139 
10 59 000 68 900 348 100 474 721 406 510 

合计 480 600 610 250 2 357 136 3 751 724 2 968 541 


由 表 7-3 中 数据 和 式 (7-5) 得 ,一 24 821. 62,b 二 0.753 171。 故 有 制造 费用 对 产量 的 
回归 方程 > 一 24 827. 62 十 0.753 1712. 

如 果 我 们 相信 ,应 用 最 小 二 乘法 估计 的 回归 方程 能 满意 地 描述 x 、y 之 间 的 关系 ,那么 对 
于 一 个 已 知 的 z 值 ,去 统计 预测 y 的 值 将 是 合理 的 。 


7.4 回归 估计 标准 误差 


回归 方程 的 一 个 重要 作用 在 于 根据 自 变 量 的 已 知 值 估计 因 变 量 的 理论 值 ( 估 计 值 )。 而 


理论 值 y 与 实际 值 y 存在 着 差距 ,这 就 产生 了 推算 结果 的 准确 性 问题 。 如 果 差 距 小 ,说 明 推 

算 结果 的 准确 性 高 ;反之 , 则 低 。 为 此 ,分 析 理 论 值 与 实际 值 的 差距 很 有 意义 。 为 了 度量 y 

的 实际 水 平和 估计 值 离 差 的 一 般 水 平 ,可 计算 估计 标准 误差 。 估 计 标 准 误差 是 衡量 回归 直 

线 代 表 性 大 小 的 统计 分 析 指 标 , 它 说 明 观 察 值 围绕 着 回归 直线 的 变化 程度 或 分 散 程度 。 
通常 用 S. 代 表 估 计 标 准 误差 ,其 计算 公式 为 : 


g jen (7-6) 
元 一 2 
用 表 7-3 的 数据 说 明 估计 平均 误差 的 计算 方法 ,可 列 出 计算 表 7-4。 


表 7-4 估计 平均 误差 计算 表 


月 份 x J 》 2 一 3 Kg gt 


1 36 000 52 500 51 941.76 558. 24 311 629.3 


o-—— 
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续 表 
月 份 z y 3 yy (y — 3° 
3 40 500 54 300 55 331. 03 —1 031. 03 1 063 023. 0 
3 42 700 56 400 56 988. 01 —588. 05 345 750. 4 
4 45 800 61 500 59 322. 83 2177.17 4 740 050 
5 46 000 58 500 59 473. 47 —973. 47 947 641 
6 48 500 61 300 61 356. 4 一 56. 40 3 180.4 
cd 52 300 63 800 64 218. 44 — 418. 44 175 094. 9 
8 54 000 66 000 65 498. 83 501. 17 251 167.9 
9 55 800 67 050 66 854. 54 195. 46 38 204. 37 
10 59 000 68 900 69 264. 69 — 364. 69 132 996. 3 


由 式 (7-6) 可 得 


(y 一 六) 
e a OTT _ 4 aun cae 
n—2 8 


结果 表明 估计 标准 差 是 1 000. 546 元 。 


回归 估计 标准 差 与 之 前 讨论 的 标准 差 的 计算 方法 是 一 致 的 ,两 者 都 是 反映 平均 差异 程 
度 和 表明 代表 性 的 指标 。 一 般 标准 差 反 映 的 是 各 变量 值 与 其 平均 数 的 平均 差异 程度 ,表明 
其 平均 数 对 各 变量 值 的 代表 性 强 弱 ; 回 归 标 准 误差 反映 的 是 因 变 量 各 实际 值 与 其 估计 值 之 
间 的 平均 差异 程度 ,表明 其 估计 值 对 各 实际 值 的 代表 性 强 弱 ,其 值 越 小 ,估计 值 y.( 或 回归 方 
程 ) 的 代表 性 越 强 ,用 回归 方程 估计 或 预测 的 结果 越 准确 。 上 述 的 计算 结果 1 000. 546 元 表 
明 实 际 成 本 总 额 与 估计 的 成 本 总 额 之 间 的 平均 相差 1 000. 546 元 。 


[7. 5 判定 系数 | 5 ”判定 系数 


回归 分 析 表 明 , 因 变量 y 的 实际 值 (观察 值 ) 
有 大 有 小 、 上 下 波动 ,对 每 一 个 观察 值 来 说 ,波动 
的 大 小 可 用 离 差 (yw 一) 来 表示 。 离 差 产 生 的 原 
因 有 两 个 方面 :一 是 受 自 变 量 zx 变动 的 影响 .二 
是 受 其 他 因素 的 影响 (包括 观察 或 实验 中 产生 的 
误差 的 影响 ) n 个 观测 值 总 的 波动 大 小 用 总 离 
差 平 方 和 》) (y, 一 3)* 表示 。 

从 图 7-3 可 以 看 出 ,每 个 观察 点 的 离 差 可 以 
分 解 为 两 部 分 : 


y 一 7 一 (入 一 妨 十 (7 一 办 (7-7) 


一 一 和 


了 = thx 


SI 


7-3 BEDE 


=X 
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其 中 ,(y 一 y) 为 剩余 离 差 ,(y 一 ) 为 回归 离 差 。 
将 上 式 两 边 平方 ,然后 对 所 有 的 nn 点 求 和 , 则 有 : 


Zo- =) a-p- 
So -3 +2 YO-HNG-y + G- 
式 中 ,交错 的 乘积 项 等 于 零 ,因而 总 离 差 平 方 和 为 : 
Zo- = 2) o- G- 


即 ， 
总 离 差 平方 和 (SST) 王 剩余 平方 和 (SSE) 十 回归 平方 和 (SSR) 

剩余 平方 和 SSE 又 称 残 差 平 方 和 , 它 反 映 了 自 变 量 x 对 因 变 量 y 的 线性 影响 之 外 的 一 
切 因 素 ( 包 括 工 对 y 的 非 线性 影响 和 测量 误差 等 ) 对 因 变 量 y 的 作用 。 

回归 平方 和 SSR 表示 在 总 离 差 平 方 和 中 ,由 于 xz 与 y 的 线性 关系 而 引起 因 变 量 y 变化 
的 部 分 。 

判定 系数 为 估计 的 回归 方程 提供 了 一 个 拟 合 优 度 的 度量 。 

对 于 样本 中 的 第 i 次 观测 值 , 因 变 量 的 观测 值 y; 和 因 变 量 的 估计 值 y; 之 间 的 离 差 称 为 
第 ; 个 残 差 。 残 差 表 示 用 y 估计 y: 的 误差 。 这 些 残 差 或 误差 的 平方 和 是 一 个 用 最 小 二 乘 
法 来 极 小 化 的 量 ,也 被 称 为 误差 平方 和 , 记 作 SSE。 那 么 残 差 或 误差 的 平方 和 可 表示 为 

SSE = D -5D 

同时 ,为 了 度量 估计 的 回归 方程 的 y; 值 与 直线 3; 的 偏离 有 多 大 ,我 们 需要 计算 另 一 个 

平方 和 , 称 之 为 回归 平方 和 , 记 作 SSR. 表 示 为 
SSR = X G-p? 

则 SST=SSE+SSR 

如 果 我 们 为 估计 的 回归 方程 给 出 一 个 拟 合 优 度 的 度量 ,那么 ,可 以 假设 残 差 或 误差 最 
小 为 0, 此 时 的 实际 观测 值 刚好 落 在 估计 的 回归 方程 直线 上 。 因 此 我 们 有 理由 相信 ,SSE 
越 小 ,SSR 值 越 接近 于 SST; 反 之 ,SSE 越 大 ,实际 观测 值 偏 离 估 计 的 回归 方程 直线 越 远 ， 
拟 合 的 优 度 越 低 。 如 果 用 一 个 比值 来 度量 这 个 拟 合 的 优 度 ,我 们 称 为 判定 系数 , 记 作 r 
以 此 有 : 

r? =SSR/SST 

”将 在 0 和 1 之 间 取 值 。 如 果 我 们 用 一 个 百分数 表示 判定 系数 ,可 以 把 r 解释 为 总 的 

离 差 平方 和 中 能 被 估计 的 回归 方程 解释 的 百分比 。 


7.6 利用 回归 方程 进行 估计 和 预测 


拟 合 的 回归 直线 方程 经 检验 具有 意义 ,就 可 以 进行 预测 。 预 测 是 回归 模型 在 统计 中 的 


重要 应 用 。 


ICAS 


E 点 估计 


在 表 7-2 产量 与 制造 费用 相关 讨论 中 ,估计 回归 方程 为 > 一 24 827. 62 十 0.753 171z, 提 
供 了 产量 x 与 制造 费用 y 之 间 关 系 的 一 种 估计 。 我 们 可 以 用 回归 方程 来 对 给 定 某 一 特定 x 
值 时 y 的 值 进行 点 估计 ,或 者 预测 某 一 特定 x 值 的 y 值 。 例 如 ,假定 11 月 份 产量 是 60 000 
件 , 运 用 回归 方程 ,我 们 可 以 得 到 : 

y=24 827. 62+0. 753 171X60 000=70 017. 88( 元 ) 
因此 , 当 产 量 为 60 000 件 时 ,制造 费用 的 点 估计 值 是 70 017. 88 元 。 


B 区 间 估 计 


对 于 预测 问题 ,除了 知道 点 估计 的 预测 值 外 ,还 希望 知道 预测 的 精度 ,因为 点 估计 不 能 
给 出 与 估计 有 关 的 任何 准确 信息 。 比 如 研究 产量 与 制造 费用 的 关系 ,可 建立 回归 方程 y=a 
十 bx, 当 已 知 产量 x 二 zo 时 ,要 预测 制造 费用 , 即 计 算出 点 估计 值 yw ,而 仅 知道 这 一 数值 意义 
不 大 ,我 们 往往 更 希望 能 给 出 一 个 预测 值 的 变动 范围 , 即 进行 区 间 估 计 。 而 这 一 预测 值 范 围 


比 只 给 yo 更 可 信 。 这 个 问题 也 就 是 对 于 给 定 的 显著 水 平 , 找 一 个 区 间 (Ti o Ta) ,使 对 应 于 
某 特定 的 zo 的 实际 值 yo 以 1 一 a 的 置信 概率 被 区 间 (T,,T,) 所 包含 。 且 可 以 证 明 置 信 概 率 
为 (1 一 a) 的 预测 区 间 为 


(%—Syo VE (ln—2) ,Yt+Sy VE(l,n—2)) 


(x0 — a)? 
Sy 一 Jef +o ee 
为 mw 的 标准 差 ,F,(1,n 一 2) 为 下 分 布 表 查 得 的 临界 值 。 


$: 


A=Sys VF.(l1,n—2) 

则 预测 区 间 为 (% 一 A,yo 十 A)。 

从 上 式 可 看 到 ,对 于 给 定 的 显著 性 水 平 ,为 了 提高 预测 精度 ,样本 容量 ”应 越 大 越 好 ， 
采集 数据 zi ,zs，… ,xz, 不 能 太 集 中 。 在 进行 预测 时 ,所 给 的 ze 不 能 偏离 工 太 大 , 太 大 时 , 预 
测 效 果 肯 定 不 好 。 统 计 预 测 时 ,当时 间 序 列 数据 发 生 了 较 大 变化 , 即 要 预测 未 来 太 远 时 ,x 
的 取 值 x。 肯 定 距 当 时 建 模 时 采集 样本 的 世相 差 太 大 ,因此 再 用 原 模型 去 预测 肯定 不 准 。 

当 样 本 量 较 大 ,或 |zx。 一 | 较 小 时 ,我 们 可 用 近似 的 预测 区 间 。 置 信 水 平 为 0.95 与 
0. 99 的 近似 预测 分 别 为 

(Ho — 2S. jo + 2S.) 


(Jo — 3S. Yo +3S.) 
对 于 表 7-3 的 数据 ,z 王 60 000 时 点 估计 值 的 计算 结果 , 现 以 1 一 xc= 0.95 的 置信 水 平 进 
行 区 间 估 计 , 则 : 
Yo —2S.=70 017. 88—2X 1 000. 546 一 68 016. 788( 元 ) 


S 


Jo +2S.=70 017. 88 一 2X1 000. 546=72 018. 972050) 
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即 在 置信 水 平 为 95% 的 条 件 下 ,预测 区 间 为 (68 016. 788， 


72 018. 972). 


在 统计 过 程 中 ,有 时 也 会 遇 到 一 个 变量 受 多 种 变量 因素 的 共同 作用 。 如 在 进行 制造 费 
用 的 分 析 时 ,可 能 受到 机 器 工作 小 时 和 直接 人 工 工时 的 共同 影响 ,这 时 可 根据 若干 历史 时 期 
的 产量 、 成 本 资料 ,经 分 析 、 计 量 后 ,确定 变动 趋势 y=a 十 bx 十 bz。 这 就 是 多 元 线性 回归 


分 析 法 。 本 书 对 此 不 再 介绍 ,只 提醒 读者 ,在 进行 多 元 分 析 时 ， 
后 才能 进行 分 析 预 测 。 


BAM 


Excel 在 相关 与 回归 分 析 中 的 


一 \ 相 关 图 的 绘制 
将 本 章 表 7-1 中 的 资料 建立 Excel 工作 表 , 如 图 7-4 所 示 。 
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回归 分 析 方 法 的 应 用 要 特别 注意 定性 分 析 与 定量 分 析 相 结合 。 当 
现 阶段 的 实际 情况 与 建 模 时 所 用 数据 资料 的 背景 发 生 较 大 变化 时 ,不 能 
机 械 地 死 套 公式 ,这 时 要 重新 收集 数据 , 尽 可 能 用 近期 数据 ,以 便 对 模型 
进行 修改 。 另 外 ,在 应 用 回归 方程 作 预 测 时 ,一 般 适 用 于 内 插 预 测 , 不 大 
适用 于 外 推 预测 。 如 需 扩 大 使 用 范围 ,应 有 充分 的 理论 依据 或 进一步 的 


也 要 进行 各 种 检验 ,检验 通过 


应 用 


OSHA SOR 一 - Bz Ho MD 2 HH 
AL = TERA 


a a 
Si A 


exe 
Ea 
FE 
[4 | 
ES 
[6| 
Ea 
[8 | 
= 
| 10 | 
[11 | 


H 


图 7-4 Excel 工作 表 


制作 相关 图 的 步骤 如 下 : 

(1) 选择 区 域 A1:B11。 

(2) 单 击 Excel 图 表 向 导 。 

(3) 在 “图 表 类 型 "中 选择 “XY 散 点 图 ”, 如 图 7-5 所 示 。 


(4) 在 “ 子 图 表 类 型 "中 选择 第 一 种 散 点 图 ,并 单 击 “ 下 一 步 ”, 即 可 得 到 散 点 图 。 


(5) 单 击 “ 完 成 ”按钮 ,并 对 图 形 进行 修饰 编辑 ,最 后 得 到 如 图 7-6 所 示 广 告 投入 与 月 平 


均 销 售 额 之 间 的 散 点 图 。 
二 ,相关 系数 


Lj 


在 Excel 中 ,相关 系数 函数 和 相关 系数 宏 提 供 了 两 种 计算 相关 系数 的 方法 。 
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图 7-5 选择 图 表 类 型 


0 20 40 
销售 额 
图 7-6 散 点 图 

(一 ) 相 关系 数 函 数 

在 Excel 中 ,CORREL 函数 和 PERSON 函数 提供 了 计算 两 个 变量 之 间 的 相关 系数 的 方 
法 ,这 两 个 函数 是 等 价 的 。 与 相关 系数 有 关 的 函数 还 有 RSQ( 相 关系 数 的 平方 , 即 判 定 系数 
下) 和 COVAR( 协 方差 函数 )。 

在 这 里 我 们 以 CORREL 函数 和 表 7-1 中 资料 为 例 ,介绍 利用 函数 计算 相关 系数 的 
Tie. 

(1) 首先 , 单 击 Excel 函数 图 钮 fx, 选择 “统计 ”函数 。 

(2) 在 “统计 ”函数 中 单 击 CORREL, 进 入 函数 向 导 。 

(3) 在 Array] 中 输入 第 一 个 变量 “广告 投入 ”的 数据 区 域 A2;All, 在 Array2 中 输入 第 
二 个 变量 “月 均 销售 额 ” 的 数据 区 域 B2:B11, 即 可 在 当前 光标 所 在 单元 格 显示 函数 的 计算 结 
果 。 如 图 7-7 所 示 。 


图 7-7 CORREL 函数 向 导 


(二 ) 相 关系 数 宏 
在 Excel 数据 分 析 宏 中 ,Excel 专门 提供 了 计算 相关 系数 宏 过 程 。 利 用 此 宏 过 程 ,可 以 
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计算 多 个 变量 之 间 的 相关 矩阵 。 

仍然 以 表 7-1 中 资料 为 例 , 利 用 相关 系数 宏 计 算 相 关系 数 矩 阵 的 过 程 如 下 : 

(1) 单 击 Excel“ 工 具 ” 菜 单 ,选择 “数据 分 析 ” 过 程 。 

(2) 在 “数据 分 析 ” 过 程 中 ,选择 相关 系数 ”过 程 。 如 图 7-8 所 示 。 

G) 在 “输入 区 域 ” 中 输入 两 个 变量 所 在 区 域 A2: B11, 数 据 以 列 排列 ,输出 区 域 选择 在 
同一 工作 表 中 的 D1:E5 区 域 里 。 计 算 结果 如 图 7-9 所 示 。 
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7-9 计算 结果 


三 \ 回 归 分 析 宏 

除了 回归 分 析 宏 外 ,Excel 虽然 提供 了 9 个 函数 用 于 建立 回归 模型 和 回归 预测 。 这 9 个 
函数 列 于 表 7-5 中 。 但 Excel 提供 的 回归 分 析 宏 仍然 具有 更 方便 的 特点 。 仍 以 表 7-1 中 广 
告 投入 与 销售 额 的 关系 资料 为 例 , 利 用 一 元 线性 回归 方程 确定 两 个 变量 之 间 的 定量 关系 。 


表 7-5 用 于 回归 分 析 的 工作 表 函 数 


函数 名 定 x 
INTERCEPT 一 元 线性 回归 模型 截 距 的 估计 值 
SLOPE 一 元 线性 回归 模型 斜率 的 估计 值 
RSQ 一 元 线性 回归 模型 的 判定 系数 (r?) 
FORECAST 依照 一 元 线性 回归 模型 的 预测 值 
STEYX 依照 一 元 线性 回归 模型 的 预测 值 的 标准 误差 
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BR 
函数 名 E X 
TREND 依照 多 元 线性 回归 模型 的 预测 值 
GROWTH 依照 多 元 指数 回归 模型 的 预测 值 
LINEST 估计 多 元 线性 回归 模型 的 未 知 参数 
LOGEST 估计 多 元 指数 回归 模型 的 未 知 参 数 


ae 


本 项 目 介绍 了 测度 两 变量 之 间 关系 的 相关 系数 。 相 关系 数 提供 了 线性 但 不 一 定 是 因果 
关系 的 一 个 度量 ,可 以 用 一 1 一 1 之 间 的 一 个 系数 来 描述 。 两 个 变量 之 间 较 高 的 相关 系数 ， 
并 不 意味 着 一 个 变量 的 变化 会 引起 另 一 个 变量 的 变化 。 并 通过 检验 来 判定 两 个 变量 之 间 的 
关系 是 否 显著 。 

本 项 目 讨论 了 回归 分 析 如 何 用 于 确定 一 个 因 变 量 y 怎样 依赖 一 个 自 变量 +。 在 建立 了 回 
归 模 型 y 一 及 十 凡 z 十 s。 线 性 回归 方程 EGSA HAr 描述 了 y 的 平均 值 或 期 望 值 是 如 何 依赖 
工 变 化 的 。 我 们 利用 样本 数据 和 最 小 二 乘法 建立 了 估计 的 回归 方程 y= by thx, KERE bo 
Al by 是 用 来 估计 模型 的 未 知 参 数 房 和 的 样本 统计 量 。 作 为 估计 的 回归 方程 拟 合 优 度 的 一 
个 度量 ,判定 系数 必 是 因 变量 > 中 的 变异 性 被 估计 方程 解释 的 部 分 所 占 的 比例 。 


ff > 
1. 表 7-6 是 两 个 变量 的 5 次 观测 值 。 
表 7-6 Bl 表 
6 n i 2 7 
m 4 9 6 17 12 


(1) 绘制 这 些 数据 的 散 点 图 。 

(2) 通过 散 点 图 观察 x 和 y 之 间 存 在 何 种 关系 ? 

(3) 计算 并 解释 相关 系数 。 

(4) 建立 估计 回归 方程 。 

2. K 7-7 是 一 组 女 运动 员 的 身高 (英寸 ) 和 体重 ( 磅 ) 的 数据 。 


表 7-7 题 2 表 
身高 68 64 62 65 66 
体重 132 108 102 115 128 


(1) 以 身高 为 自 变量 ,绘制 这 些 数据 的 散 点 图 。 
(2) 根据 散 点 图 ,说 明 两 变量 之 间 存在 什么 关系 ? 
(3) 尝试 画 一 条 通过 这 些 数据 的 直线 ,来 近似 身高 的 体重 之 间 的 关系 。 
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(4) 计算 bo .bi 的 值 ,建立 估计 回归 方程 。 

(5) 假定 一 名 运动 员 的 身高 是 63 英寸 ,你 估计 她 的 体重 是 多 少 ? 

3. 调查 机 构 分 析 了 一 组 大 学 生 毕 业 后 的 资 薪 收 入 和 在 校 学 习 成 绩 的 相关 数据 ,给 出 了 
这 组 数据 的 估计 回归 方程 是 y==1 790. 5 十 581. 1z。 数 据 见 表 7-8。 


表 7-8 题 3 表 
平均 成 绩 x AR y 平均 成 绩 工 月 薪 y 
2.6 3 300 3.2 3 500 
3.4 3 600 355 3 900 
3.6 4 000 2.9 3 600 


(1) 计算 SST、SSR 和 SSE 的 值 。 
(2) 计算 判定 系数 于, 请 对 拟 合 优 度 做 出 评述 。 
(3) 计算 样本 的 相关 系数 。 
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项 目 8 时间 序列 分 析 及 预测 


= 


>>>| 实践 中 的 统计 
职业 健康 诊所 火灾 损失 的 评估 


职业 健康 诊所 (Nevada Occupational Health Clinic) 是 一 家 私人 医疗 诊所 。 这 个 诊所 专 
攻 工 业 医 疗 ,并且 在 该 地 区 经 营 已 经 超过 15 年 。2012 年 初 ,该 诊所 进入 了 增长 的 阶段 。 在 
其 后 的 26 个 月 里 ,该 诊所 每 个 月 的 账单 收入 从 57 000 美元 增长 到 超过 300 000 美元 。 直 至 
2017 年 4 月 6 日 , 当 诊所 的 主 建 筑 物 被 烧毁 时 ,诊所 一 直 经 历 着 持续 性 的 增长 。 

诊所 的 保险 单 包 括 实物 财产 和 设备 ,也 包括 出 于 正常 商业 经 营 的 中 断 而 引起 的 收入 损 
失 。 确 定 实物 财产 和 设备 在 火灾 中 的 损失 额 , 受 理财 产 的 保险 索赔 要 求 是 一 个 相对 简单 的 
事情 。 但 是 确定 在 进行 重建 诊所 的 7 个 月 中 ,收入 的 损失 额 是 很 复杂 的 , 它 涉及 业主 和 保险 
公司 之 间 的 讨价还价 。 对 如 果 没 有 发 生火 灾 , 诊 所 的 账单 收入 “将 会 有 什么 变化 ”的 计算 , 没 
有 预先 制定 的 规则 。 为 了 估计 失去 的 收入 ,诊所 用 一 种 预测 方法 ,来 测算 在 7 个 月 的 停业 期 
间 将 要 实现 的 营业 增长 。 在 火灾 前 的 账单 收入 的 实际 历史 资料 ,将 为 拥有 线性 趋势 和 季节 
成 分 的 预测 模型 提供 基础 资料 。 这 个 预测 模型 使 诊所 得 到 损失 收入 的 一 个 准确 的 估计 值 ， 
这 个 估计 值 最 终 被 保险 公司 所 接受 。 

这 是 一 个 时 间 数 列 分 析 方法 在 保险 业务 中 的 成 功 案例 。 这 个 案例 中 的 时 间 序 列 分 析 方 
法 的 统计 思想 对 现代 经 济 管理 同样 具有 重要 的 启迪 和 现实 意义 。 例 如 对 于 企业 销售 收入 和 
销售 成 本 的 预测 ,我 们 当然 要 观察 过 去 的 实际 资料 ,根据 这 些 历 史 资料 .我们 可 以 对 其 发 展 
IKF .发展 速度 进行 分 析 ,也 可 能 得 到 销售 的 一 般 水 平 或 趋势 ,如 销售 收入 随时 间 增 长 或 下 
降 的 趋势 。 对 这 些 资料 的 进一步 观察 ,还 可 能 显示 一 种 季节 轨迹 ,如 每 年 的 销售 高 峰 出 现在 
第 三 季度 ,而 销售 低谷 出 现在 第 一 季度 以 后 。 通 过 观察 历史 资料 ,可 以 对 过 去 的 销售 轨迹 有 
较 好 的 了 解 ,因此 对 产品 的 未 来 销售 情况 ,可 以 做 出 较为 准确 .公正 的 判断 。 时 间 数 列 分 析 ， 
能 反映 客观 事物 的 发 展 变化 ,能 揭示 客观 事物 随时 间 演 变 的 趋势 和 规律 。 
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任何 现象 , 随 着 时 间 的 推移 ,都 会 呈现 出 一 种 在 时 间 上 的 发 展 和 运动 过 程 ; 时 间 数 列 
分 析 ,是 指 从 时 间 的 发 展 变化 角度 ,研究 客观 事物 在 不 同时 间 的 发 展 状况 ,探索 其 随时 间 
推移 的 演变 趋势 和 规律 ,揭示 其 数量 变化 和 时 间 的 关系 ,预测 客观 事物 在 未 来 时 间 上 可 能 
达到 的 数量 和 规模 。 时 间 数 列 分 析 的 依据 是 时 间 数 列 ( 又 称 动 态 数 
列 )。 我 们 把 同一 现象 在 不 同时 间 上 的 相继 观察 值 排列 而 成 的 数列 称 
为 时 间 数 列 或 时 间 序 列 。 从 表 8-1 可 以 看 出 ,时 间 序 列 形式 上 包含 两 
部 分 :一 是 现象 所 属 的 时 间 , 二 是 现象 在 不 同时 间 上 的 观察 值 , 这 两 部 
分 是 任何 一 个 时 间 数 列 所 应 具备 的 两 个 基本 要 素 。 现 象 所 属 的 时 间 可 
以 是 年 份 .季度 ,月份 或 其 他 任何 时 间 形 式 。 现 象 的 观察 值 根据 表现 形 
式 不 同 有 绝对 数 、 相 对 数 和 平均 数 ,因此 ,从 观察 表现 形式 上 看 .时 间 序 列 可 分 为 绝对 数 时 间 
数列 、 相 对 数 时 间 数 列 和 平均 数 时 间 数 列 。 
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表 8-1 中 国 国 内 生产 总 值 及 相关 指标 的 时 间 序 列 数据 


年 份 | 国内 生产 总 值 ( 亿 元 )| 第 三 产业 占 GDP EE) | 年 底 总 人 口 ( 万 人 ) | 职工 平均 货币 工资 (元 ) 
1990 18 547.9 31.3 114 333 2 140 
1991 21 617.9 33.4 115 823 2 340 
1992 26 638. 1 34.3 117 171 ani 
1993 34 634.4 32.7 118 517 3 371 
1994 46 759. 4 31.9 119 850 4 538 
1995 58 478.1 30.7 121 121 5 500 
1996 67 884. 6 30. 1 122 889 6 210 
1997 74 462. 6 30. 9 123 626 6 470 
1998 78 345. 2 32.1 124 810 7 479 
1999 81 910.9 33. 0 125 909 8 346 


资料 来 源 :《 中 国 统计 年 鉴 ), 中 国 统计 出 版 社 ,2001. 


> 8.1.1 时 间 序 列 类 型 


E 绝对 数 时 间 数 列 


绝对 数 时 间 数 列 又 称 总 量 指标 数列 ,是 指 将 反映 现象 总 规模 ,总 水 平 的 某 一 总 量 指标 在 
不 同时 间 上 的 观察 数值 按时 间 先 后 顺序 排列 起 来 所 形成 的 数列 。 总 量 指标 数列 是 计算 相对 
指标 和 平均 指标 ,进行 各 种 时 间 数 列 分 析 的 基础 。 

按 其 指标 所 反映 时 间 状 况 的 不 同 , 总 量 指标 数列 又 分 为 时 期 数列 ( 见 表 8-1 第 2 栏 ) 和 
时 点 数列 ( 见 表 8-1 第 4 栏 )。 时 期 数列 中 所 排列 的 指标 为 时 期 指标 ,各 时 期 上 的 数值 分 别 
反映 现象 在 这 一 段 时 期 内 所 达到 的 总 规模 .总 水 平 , 是 现象 在 这 一 段 时 期 内 发 展 过 程 的 累积 
总 量 。 观 察 值 具有 可 加 性 及 数值 大 小 与 所 属 时 期 长 短 有 密切 联系 的 特点 。 时 点 数列 中 所 排 
列 的 指标 为 时 点 指标 ,各 时 点 上 的 数值 分 别 反 映 现象 在 各 该 时 点 上 所 达到 的 总 规模 ,总 水 
平 ,是 现象 在 某 一 时 点 上 的 数量 表现 。 观 察 值 具有 时 间 上 的 不 可 加 性 及 各 时 点 上 观察 值 大 
小 与 相 邻 两 时 点 间 间 隔 长 短 无 密切 联系 的 特点 。 


用 2. 相对 数 和 平均 数 时 间 数 列 


相对 数 和 平均 数 时 间 数 列 又 称 为 相对 指标 和 平均 指标 数列 。 指 将 反映 现象 相对 水 平 、 
平均 水 平 的 某 一 相对 指标 或 平均 指标 在 不 同时 间 上 的 观察 值 按 时 间 先 后 顺序 排列 起 来 所 形 
成 的 数列 ( 见 表 8-1 的 第 3 栏 和 第 5 栏 )。 不 论 是 相对 指标 还 是 平均 指标 ,其 共同 点 都 是 由 总 
量 指标 派生 而 来 ,反映 一 种 对 比 或 平均 的 概念 ;不 同时 间 上 的 相对 数 或 平均 数 不 能 相 加 , 即 
相 加 以 后 没有 意义 。 
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É 编制 时 间 数列 应 注意 的 问题 


编制 时 间 数 列 的 目的 ,是 为 了 进行 时 间 数 列 分 析 , 因 而 ,保证 数列 中 各 项 观察 值 具有 可 
比 性 ,是 编制 时 间 数 列 的 基本 原则 。 所 谓 可 比 性 ,是 要 求 各 观察 值 所 属 时 间 .总 体 范 围 .经 济 
内 容 、. 计 算 方法 .计算 价格 ` 计 量 单位 等 可 比 。 具 体 含义 如 下 : 

(1) 各 项 观察 值 所 属 时间 可 比 。 即 要 求 各 观察 值 所 属 时 间 的 一 致 性 。 对 时 期 数列 而 
言 , 由 于 各 观察 值 的 大 小 与 所 属 时 期 的 长 短 直接 相关 ,因此 各 观察 值 所属 时 间 的 长 短 应 该 一 
致 ,否则 不 便于 对 比分 析 。 对 于 时 点 数列 ,虽然 两 时 点 间 间 隔 长 短 与 观察 值 无 明显 关系 ,但 
为 了 更 好 地 反映 现象 的 发 展 变化 状况 ,两 时 点 间 的 间隔 也 应 尽 可 能 相等 。 

(2) 各 项 观察 值 总 体 范 围 可 比 。 这 是 就 所 属 空间 范围 而 言 , 如 地 区 范围 .隶属 范围 .分 
组 范围 等 。 当 时 间 数 列 中 某 些 观察 值 总 体 范围 不 一 致 时 ,必须 进行 适当 调整 使 其 一 致 ,否则 
前 后 期 指标 数值 不 能 直接 对 比 。 

(3) 各 项 观察 值 经 济 内 容 可 比 。 指 标的 经 济 内 容 是 由 其 理论 内 涵 所 决定 的 , 随 着 社 
会 经 济 条 件 的 变化 ,有 些 指 标的 经 济 内 容 发 生 了 变化 。 对 于 名 称 相同 而 经 济 内 涵 不 一 臻 
的 指标 ,尤其 要 注意 这 一 点 ,务必 使 各 时 间 上 的 观察 值 内 涵 一 致 ,否则 也 不 具备 可 比 性 。 
例如 ,我 国 的 工业 总 产值 指标 ,有 的 年 份 包括 了 乡村 企业 的 工业 产值 ,有 的 年 份 则 不 
包括 。 

(4) 各 项 观察 值 的 计算 方法 可 比 。 对 于 指标 名 称 总 体 范 围 和 经 济 内 容 都 相同 的 指标 计 
算 方法 不 同 也 会 导致 数值 差异 ,有 时 甚至 是 极 大 的 差异 。 例 如 国内 生产 总 值 (GDP) ,按照 生 
产 法 .支出 法 、 分 配 法 计算 的 结果 就 有 差异 。 因 此 ,同一 时 间 数 列 中 ,各 个 时 期 (时 点 ?指标 值 
的 计算 方法 要 统一 。 如 果 从 某 一 时 期 ,计算 方法 做 了 重大 改变 ,那么 发 布 资料 必须 注 明 ,以 
便 动 态 比较 时 进行 调整 。 

(5) 计算 价格 和 计量 单位 可 比 。 统 计 指 标的 计算 价格 种 类 很 多 ,有 现行 价格 和 不 变价 
格 之 分 。 不 变价 格 为 了 适应 客观 经 济 条 件 的 变化 也 在 不 断 调整 ,形成 了 多 个 时 期 的 不 变价 
格 ,编制 时 间 序 列 遇 到 前 后 时 期 所 用 的 计算 价格 不 同 ,就 需要 进行 调整 ,使 其 统一 。 对 于 实 
物 指标 的 时 间 序 列 , 则 要 求 计量 单位 保持 一 致 ,否则 也 要 进行 调整 。 


PP 8. 1.2 时 间 数 列 常用 分 析 方 法 
时 间 数 列 分 析 最 常用 的 方法 有 两 种 ,一 是 指标 分 析 法 ,二 是 构成 因素 分 析 法 。 


由 1， 时 间 数列 指标 分 析 法 


所 谓 指标 分 析 法 ,是 指 通 过 计算 一 系列 时 间 数 列 分 析 指 标 ,包括 发 展 水 平平 均 发 展 水 
平 、 增 减 量 , 平 均 增 减 量 发展 速度 .平均 发 展 速度 、 增 减速 度 .平均 增 减 速度 等 来 揭示 现象 的 
发 展 状况 和 发 展 变化 程度 。 


用 2. 时 间 数 列 构成 因素 分 析 法 
这 种 方法 是 将 时 间 数 列 看 作 是 由 长 期 趋势 、 季 节 变 动 循环 变动 和 不 规则 变动 几 种 因 
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素 所 构成 ,通过 对 这 些 因素 的 分 解 分 析 , 揭示 现象 随时 间 变 化 而 演变 的 规律 ,并 在 揭示 这 
些 规律 的 基础 上 ,假定 事物 今后 的 发 展 趋势 遵循 这 些 规 律 ,从 而 对 事物 的 未 来 发 展 做 出 
预测 。 

时 间 数 列 的 这 两 种 基本 分 析 方 法 ,各 有 不 同 的 特点 和 作用 ,各 揭示 不 同 的 问题 和 状况 ， 
分 析 问题 时 应 视 研 究 的 目的 和 任务 ,分 别 采 用 或 综合 应 用 。 


8.2 ”时 间 数 列 的 水 平分 析 


时 间 数 列 水 平分 析 指 标 有 发 展 水 平 .平均 发 展 水 平 . 增 减 量 、 平 均 增 减 量 四 种 。 


> 8.2.1 发 展 水 平 


在 时 间 序 列 中 ,用 zi(i 二 1,2,…,n) 表 示 现 象 所 属 的 时 间 ,a; 表 示 现 象 在 不 同时 间 上 的 观 
察 值 。w (i 二 1,2,…,n) 也 称 为 现象 在 时 间 t; 上 的 发 展 水 平 , 它 表 示 现 象 在 某 一 时 间 上 所 达 
到 的 一 种 数量 状态 。 若 观察 的 时 间 范 围 为 ,ts，…,t, 相 应 的 观察 值 表 示 为 ai vg vot ,a 
其 中 ai 称 为 最 初 发 展 水 平 ,a, 称 为 最 末 发 展 水 平 。 若 将 整个 观察 时 期 内 的 各 观察 值 与 某 个 
特定 时 期 i。 作 比较 时 ,时 间 1 可 表示 为 to ,ti，…,t, 相 应 的 观察 值 表示 为 ao vay eee ea, ,其 中 
uo 称 为 基期 水 平 ,a, 称 为 报告 期 水 平 。 


> 8.2.2 平均 发 展 水 平 


平均 发 展 水 平 是 现象 在 时 间 t;(i 二 1,2,…,n) 上 取 值 的 平均 数 ,又 称 为 序 时 平均 数 或 动 
态 平均 数 。 它 可 以 概括 性 地 描述 出 现象 在 一 段 时 期 内 所 达到 的 一 般 水 平 。 序 时 平均 数 作 为 
一 种 平均 数 ,与 静态 平均 数 有 相同 点 , 即 它们 都 抽象 了 现象 的 个 别 差 异 , 以 反映 现象 总 体 的 
一 般 水 平 。 但 二 者 又 有 明显 的 区 别 , 主 要 表现 在 序 时 平均 数 抽象 的 是 现象 在 不 同时 间 上 的 
数量 差异 ,因而 它 能 够 从 动态 上 说 明 现象 在 一 定时 期 内 发 展 变化 的 一 般 趋势 ;静态 平均 数 抽 
象 的 是 总 体 各 单位 某 一 数量 标志 值 在 同一 时 间 上 的 差异 ,因此 , 它 是 从 静态 上 说 明 现 象 总 体 
各 单位 的 一 般 水 平 。 由 于 不 同时 间 序 列 中 观察 值 的 表现 形式 不 同 , 序 时 平均 数 有 不 同 的 计 
算 方法 。 


E 绝对 数 时 间 数 列 的 序 时 平均 数 


绝对 数 时 间 数 列 序 时 平均 数 的 计算 方法 是 最 基本 的 , 它 是 计算 相对 数 或 平均 数 时 间 数 
列 序 时 平均 数 的 基础 。 绝 对 数 时 间 数 列 有 时 期 数列 和 时 点 数列 之 分 , 序 时 平均 数 的 计算 方 
法 也 有 所 区 别 。 
(1) 时 期 数列 的 序 时 平均 数 , 其 计算 公式 为 
a=% tate ba 


n n 


(8-1) 
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式 中 ,2 为 序 时 平均 数 ,” 为 观察 值 的 个 数 。 
例如 ,对 表 8-1 中 的 国内 生产 总 值 时 间 序 列 ,计算 年 平均 国内 生产 总 值 。 
根据 时 期 数列 序 时 平均 数 公 式 有 
元 da 18 547. 9 +21 617.9 == +81 910. 9 
n 10 
(2) 由 时 点 数列 计算 序 时 平均 数 。 在 社会 经 济 统计 中 一 般 是 将 一 天 看 作 一 个 时 点 ， 
即 以 “一 天 ”作为 最 小 时 间 单 位 。 这 样 时 点 数列 可 认为 有 连续 时 点 和 间断 时 点 数列 之 分 ; 
而 间断 时 点 数列 又 有 间隔 相等 与 间隔 不 等 之 别 。 其 序 时 平均 数 的 计算 方法 略 有 不 同 , 分 
述 如 下 : 
连续 时 点 数列 计算 序 时 平均 数 。 在 统计 中 ,对 于 逐日 排列 的 时 点 资料 , 视 其 为 连续 时 点 
资料 。 这 样 的 连续 时 点 数列 ,其 序 时 平均 数 公式 可 按 式 (8-1) 计 算 , 即 : 
Sa 
n 
例如 ,存款 (贷款 ) 平 均 余 额 指标 ,通常 就 是 由 报告 期 内 每 日 存款 (贷款 ) 余 额 之 和 除 以 报 
告 期 日 历数 而 求 得 。 
另 一 种 情形 是 ,资料 登记 的 时 间 单 位 仍然 是 1 天 ,但 实际 上 只 在 指标 值 发 生变 动 时 才 记 
录 一 次 。 此 时 需 采 用 加 权 算 术 平 均 数 的 方法 计算 序 时 平均 数 , 权 数 是 每 一 指标 值 的 持续 
天 数 。 


50 927. 9( 亿 元 ) 


(8-2) 


a= 


计算 公式 如 下 ， 
a= xe (8-3) 
例如 , 表 8-2 是 某 商 品 5 月 的 库存 量 数据 ,计算 5 月 份 平均 日 库存 量 。 
表 8-2 某 种 商品 5 月 库存 资料 
日 期 1~4 5~10 11~20 21~26 27~31 
库存 量 ( 台 ) 50 55 40 35 30 


根据 式 (8-3) ,该 商品 5 月 份 平均 日 库存 量 为 


_ Daf _50x4+55X6+40x10+35X6+30Xx5 
oy. 4 十 6 十 10 十 6 十 5 
间断 时 点 数列 计算 序 时 平均 数 。 实 际 统计 工作 中 .很 多 现象 并 不 是 逐日 对 其 时 点 数据 
进行 统计 ,而 是 隔 一 段 时 间 ( 如 一 月 、 一 季度 .一 年 等 ) 对 其 期 末 时 点 数据 进行 登记 。 这 样 得 
到 的 时 点 数列 称 为 间断 时 点 数列 。 如 果 每 隔 相 同 的 时 间 登 记 一 次 ,所 得 数列 称 为 间隔 相等 
的 间断 时 点 数列 ;如 果 每 两 次 登记 时 间 的 间隔 不 尽 相 同 ,所 得 数列 称 为 间隔 不 等 的 间断 时 点 
数列 。 当 其 时 点 资料 是 以 月 度 .季度 .年度 为 时 间 间 隔 单位 .我 们 已 不 可 能 像 连续 时 点 资料 
那样 求 得 准确 的 时 点 平均 数 。 这 种 情况 下 ,我 们 可 以 根据 资料 所 属 时 间 的 间隔 特点 ,选用 不 
同 的 计算 公式 。 对 于 间隔 相等 的 资料 ,采用 “ 首 末 折 半 ”; 对 于 间隔 不 等 的 资料 ,采用 “间隔 加 
权 ” 的 方法 计算 序 时 平均 数 。 
某 商业 企业 2014 年 第 二 季度 某 种 商品 的 库存 量 见 表 8-3, 计 算 该 商品 第 二 季度 月 平均 
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库存 量 。 
表 8-3 某 商业 企业 2014 年 第 二 季度 某 商 品 库存 量 
月 份 3 月 末 4 月 末 5 月 末 6 AAR 
库存 量 ( 百 件 ) 66 72 64 68 


4 este =OS? — crite) 


5 Aes Et ht 2 时 一 68( 百 件 ) 


6 月 平均 库存 量 一 名 了 人 一 66( 百 件 ) 


第 二 季度 平均 库存 量 一 到 一 5 二 6 一 67. 67( 百 件 ) 
为 简化 计算 过 程 , 上 述 计算 步骤 可 表示 为 


Lea M N ee 86 +-72-+04+88 
第 二 季度 平均 库存 量 一 一 3 
一 67. 67( 百 件 ) 
根据 上 述 计 算 过 程 可 推导 出 计算 公式 为 
ata, etag. 二 二 


k a—t 


Frat te-14+9 
7 一 1 
该 公式 形式 上 表现 为 首 末 两 项 观察 值 折 半 , 故 称 为 “ 首 末 折 半 法 ”。 这 种 方法 适用 于 间 
隔 相 等 的 间断 时 点 数列 求 序 时 平均 数 。 
K 8-4 列 示 了 我 国 1990 一 1999 年 年 末 人 口 的 部 分 年 份 资料 ,计算 年 平均 人 口 数 。 
表 8-4 中 国 1990 一 1999 年 部 分 年 份 年 末 人 口 数 


(8-4) 


年 份 1990 1992 1995 1998 1999 


年 底 总 人 口 ( 万 人 ) 114 333 117 171 121 121 124 810 125 909 


对 资料 进行 观察 分 析 , 属 间隔 不 等 的 间断 时 点 资料 ,采用 “间隔 加 权 ” 方 法 。 


(ai 十 az ) PE astoa) fe <p tect iD ps 
二 二 2 2 
fi a “tfii 
114 3 171xy | 117 L I 121x3 | 121 121 十 124 810x3 | 124 S 989 1 
5 
=120 355. 33( 万 人 ) (8-5) 
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E 相对 数 或 平均 数 时 间 数列 的 序 时 平均 数 


相对 数 和 平均 数 是 两 个 有 联系 的 相对 数 对 比 求 得 ,用 符号 表示 即 = 因此 ,由 相对 
数 或 平均 数 数列 计算 序 时 平均 数 , 不 能 直接 根据 该 相对 数 或 平均 数 数列 中 各 项 观察 值 简单 
平均 计算 ( 即 不 应 当 用 5 二 D c/n 的 公式 ) ,而 应 当先 分 别 计算 构成 该 相对 数 或 平均 数 数列 
的 分 子 数列 和 分 母 数列 的 序 时 平均 数 ,再 对 比 求 得 。 用 公式 表示 为 
z=4 (8-6) 
例如 , 表 8-5 是 某 企 业 2014 年 第 四 季度 职工 人 数 数据 ,计算 工人 占 职工 人 数 的 平均 比重 。 
表 8-5 某 企业 2014 年 四 季度 职工 人 数 资料 


月 份 9 月 末 10 月 末 11 月 末 12 月 末 
工人 人 数 / 人 342 355 358 364 
职工 人 数 / 人 448 456 469 474 
工人 占 职工 比重 /% 76. 34 77. 85 76. 33 76.79 


~ & _a,/2+a, tas t-ta,/2 
bby /2F by Fb, + +b, /2 


_ 342/2+355+358+364/2 _ P 
448/2+456+469+474/2 76.91% 


表 8-6 是 某 企 业 下 半年 劳动 生产 率 数据 ,计算 平均 月 劳动 生产 率 和 下 半年 平均 职工 劳 
动 生产 率 。 


表 8-6 某 企业 下 半年 劳动 生产 率 资料 


月 份 6 月 7 月 8 月 9 月 10 H 11 月 12 H 
总 产值 /万 元 (a) 87 91 94 96 102 98 91 
月 末 职 工人 数 / 人 (b) 460 470 480 480 490 480 450 
劳动 生产 率 /( 元 /人 )(c) 1 948 1 957 1 979 2 000 2 103 2 021 1 957 


从 表 8-6 可 以 看 到 ,劳动 生产 率 的 分 子 总 产值 是 时 期 指标 ,分 母 职工 人 数 是 时 点 指标 ， 
计算 平均 月 劳动 生产 率 应 用 下 列 公式 : 
(Za) 


=E O/2 by +b; +-b,/2)/m—1) 


代入 表 中 数据 : 


(91+94+96+102+98+91)/6 = = 
©=(qg0/2-F470+480-+480-F 490+ 480+ 450/2)/=1) 2 003. 5( 元 /人 ) 


若 计算 下 半年 平均 职工 劳动 生产 率 , 则 有 两 种 计算 形式 。 一 种 是 用 下 半年 平均 月 劳动 
生产 率 乘 月 份 个 数 n, 即 ve = 2 003.5 X 6=12 021( 元 /人 ) 得 出 , 另 一 种 则 采用 下 列 公式 
计算 ; 


o——. 
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da 
© Oy /2 +b, Fb; + +6,/2)/a—D 
代入 表 中 数据 
91 十 94 十 96 十 102 十 98 十 91 = 
E= (450/24 470+ 480-+ 480+ 490 +480 450/271) ~ 12 021( 元 /人 ) 
> 8.2.3 增 减 量 


增 减 量 是 报告 期 水 平 与 基期 水 平 之 差 , 用 以 说 明 现 象 在 一 定时 期 内 增 减 的 绝对 数量 。 
由 于 所 选择 基期 的 不 同 , 增 减 量 可 分 为 逐 期 增 减 量 和 累积 增 减 量 。 

逐 期 增 减 量 是 报告 期 水 平 与 其 前 一 期 水 平 之 差 , 说 明 本 期 较 上 期 增 减 的 绝对 数量 ,用 公 
式 表示 为 : 


Qai—aiy (i=1,2;* sn) (8-7) 
累积 增 减 量 是 报告 期 水 平 与 某 一 固定 基期 水 平 之 差 , 说 明报 告 期 与 某 一 固定 时 期 相 比 
增 减 的 绝对 数量 。 用 公式 表示 为 
aiao (i=1,2,°",n) (8-8) 
逐 期 增 减 量 与 累积 增 减 量 之 间 存 在 一 定 的 关系 :各 逐 期 增 减 量 的 和 等 于 相应 时 期 的 累 
积 增 减 量 ; 两 相 邻 时 期 累积 增 减 量 之 差 等 于 相应 时 期 的 逐 期 增 减 量 。 用 公式 分 别 表 示 为 


>) laan) = an — ao (8-9) 
i=l 
ai— Ao — (ai-ı — ao) =a; — a;i- (151,2, sn) 
具体 计算 实例 见 表 8-7. 
表 8-7 1990 一 1999 年 国内 生产 总 值 单位 : 亿 元 
年 份 1990 | 1991 | 1992 | 1993 | 1994 | 1995 | 1996 | 1997 | 1998 | 1999 
国内 生产 总 值 ”|18 547.9|21 617. 9126 638. 1|34 634. 4146 759. 4|58 478. 1/67 884. 6/74 462. 6|78 345. 2/81 910. 9 
逐 期 增长 量 3070 | 5 020. 2} 7 996. 312 125 |11 718. 7| 9 406. 5| 6578 | 3882.6| 3 565. 7 
累积 增长 量 3 070 | 8 090. 2/16 086. 引 28 211. 5/39 930. 2/49 336. 7|55 914. 7|59 797. 3| 63 363 


8.2.4 平均 增 减 量 


平均 增 减 量 是 观察 期 各 逐 期 增 减 量 的 序 时 平均 数 , 用 于 描述 现象 在 观察 期 内 平均 每 期 
增 减 的 数量 。 它 可 以 根据 逐 期 增 减 量 求 得 ,也 可 以 根据 累积 增 减 量 求 得 。 计 算 公 式 为 


te ded 
平均 增 减 量 = 一 =% ra (8-10) 
其 中 ,为 逐 期 增 减 量 个 数 。 
根据 表 8-7 资料 ,计算 国内 生产 总 值 平均 增长 量 : 
国内 生产 总 值 平均 增长 量 一 2 O70 3 565.7 _ 83 363 7 040. 3( 亿 元 ) 
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8-3“ 时 间 数 列 速度 指标 分 析 


时 间 数 列 的 速度 指标 有 发 展 速度 . 增 减 速度 .平均 发 展 速度 ,平均 增 减 速度 。 


8.3.1 发 展 速度 
发 展 速度 是 报告 期 发 展 水 平 与 基期 发 展 水 平 之 比 , 用 于 描述 现象 在 观察 期 内 相对 的 发 
展 变化 程度 。 


由 于 采用 的 基期 不 同 , 发 展 速度 可 以 分 为 环比 发 展 速度 和 定 基 发 展 速度 。 环 比 发 展 速 
度 是 报告 期 水 平 与 前 一 时 期 水 平 之 比 , 说 明 现象 逐 期 发 展 变化 的 程度 ; 定 基 发 展 速 度 是 报告 
期 水 平 与 某 一 固定 时 期 水 平 之 比 ,说 明 现 象 在 整个 观察 期 内 总 的 发 展 变化 程度 。 


设 时 间 序 列 的 观察 值 为 a;, (i 二 1,2,…,n) ,发 展 速度 为 R, 环 比 发 展 速 度 和 定 基 发 展 速 
度 的 一 般 形式 可 以 写 为 

环比 发 展 速度 : R=- -i=l n) (8-11) 

定 基 发 展 速度 : AO Gli ad) (8-12) 


环比 发 展 速度 与 定 基 发 展 速度 之 间 存 在 着 重要 的 数量 关系 :观察 期 内 各 个 环比 发 展 速 
度 的 连 乘积 等 于 相应 时 期 的 定 基 发 展 速度 ;两 个 相 邻 的 定 基 发 展 速度 ,用 后 者 除 以 前 者 ,等 
于 相应 时 期 的 环比 发 展 速度 。 即 : 


TA = 全 (I 为 连 乘 符号 ) (8-13) 


和 (8-14) 


do do qai-1 


利用 上 述 关系 ,可 以 根据 一 种 发 展 速度 去 推算 另 一 种 发 展 速度 。 


> 8.3.2 增 减 速度 


增 减速 度 也 称 增 减 率 , 是 增 减 量 与 基期 水 平 之 比 ,用 于 说 明报 告 期 水 平 较 基期 水 平 
的 相对 增 减 程度 。 它 可 以 根据 增 减 量 求 得 ,也 可 以 根据 发 展 速度 求 得 。 其 基本 计算 公 
式 为 


二 _ 增 减 量 -报告 期 水 平一 基期 水 平 _ 公 展 ; 
HELE BE = sek oe 基期 水 平 发 展 速度 一 1 (8-15) 


从 上 式 可 以 看 出 , 增 减 速度 等 于 发 展 速度 减 1, 但 各 自 说 明 的 问题 是 不 同 的 。 发 展 速度 
说 明报 告 期 水 平 较 基期 发 展 到 多 少 ; 而 增 减速 度 说 明报 告 期 水 平 较 基 期 增 减 多 少 ( 扣 除了 基 
数 )。 当 发 展 速度 大 于 1 时 , 增 减 速度 为 正 值 .表示 现象 的 增长 程度 ; 当 发 展 速度 小 于 1 时 ， 
增 减 速度 为 负 值 ,表示 现象 的 降低 程度 。 

由 于 采用 的 基期 不 同 , 增 减 速度 也 可 分 为 环比 增 减 速度 和 定 基 增 减速 度 。 前 者 是 逐 期 


Q 
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增 减 量 与 前 一 时 期 水 平 之 比 , 用 于 描述 现象 逐 期 增 减 的 程度 ;后 者 是 累积 增 减 量 与 某 一 固定 
时 期 水 平 之 比 ,用 于 描述 现象 在 观察 期 内 总 的 增 减 程度 。 
设 增 减速 度 为 G, 环 比 增 减 速度 和 定 基 增 减 速度 的 公式 可 写 为 


环比 增 减 速度 : Gi G= 2an) (8-16) 
i ei 
定 基 增 减速 度 : Gy =SB= ES 1G= 1,2.) (8-17) 
0 0 


需要 指出 ,环比 增 减 速度 与 定 基 增 减 速度 之 间 没 有 直接 的 换算 关系 。 在 由 环比 增 减 
速度 推算 定 基 增长 速度 时 ,可 先 将 各 环比 增长 速度 加 1 后 连 乘 ,再 将 结果 减 1, 即 得 定 基 
增 减速 度 。 

以 表 8-1 数据 为 例 ,计算 过 程 见 表 8-8. 

表 8-8 国内 生产 总 值 发 展 速度 计算 表 
年 份 2004 | 2005 | 2006 | 2007 2008 | 2009 | 2010 | 2011 2012 | 2013 


国内 生产 总 值 | 18 547. 9|21 617. 9| 26 638. 1 | 34 634. 4| 46 759. 4| 58 478. 1|67 884. 6|74 462. 6|78 345. 2|81 910. 9 


‘aad 逐 期 | 一 | 3070 | 5020.2) 7996.3/12 125 |11 718.7] 9406.5] 6578 | 3 882.6] 3565.7 

累积 | 一 | 3070 | 8 090.2} 16 086.5] 28 211.5] 39 930. 2] 49 336. 7/55 914. 7/59 797. 3/63 363. 0 
发 展 速 | 环比 | 一 116.6| 123.2| 130.0| 135.0| 125.1| 116.1| 109.7| 105.2| 104.6 
度 (%)| 定 基 116.6| 143.6| 186.7| 252.1| 315.3| 366.0| 401.5| 422.4| 441.6 
增 减速 | 环比 16.6| 23.2| 30.0| 35.0| 25.1| 16.1 9.7 5.2 4.6 
度 (%)| 定 基 16.6| 43.6| 86.7| 152.1| 215.3| 266.0| 301.5| 322.4| 341.6 


> 8. 3.3 平均 发 展 速度 


平均 发 展 速度 是 各 个 时 期 环比 发 展 速度 的 平均 数 , 用 于 描述 现象 在 整个 观察 期 内 平均 
发 展 变化 的 程度 。 

计算 平均 发 展 速度 的 常用 方法 是 水 平 法 。 水 平 法 又 称 几 何平 均 法 , 它 是 根据 各 期 的 环 
比 发 展 速度 采用 几何 平均 法 计算 出 来 的 。 计 算 公式 为 


R= (2 nt ae = fe (8-18) 
式 中 ,R 为 平均 发 展 速度 ;n 为 环比 发 展 速度 的 个 数 , 它 等 于 观察 数据 的 个 数 减 1 。 
已 知 国内 生产 总 值 1990 一 1999 年 环比 发 展 速度 见 表 8-8 ,计算 平均 发 展 速度 。 


根据 式 (8-18) 得 


R = /116. 6% X 123.2% X-X 104. 6% 
= 441.6% 
=117.9% 


从 水 平 法 计算 平均 发 展 速度 的 公式 中 可 以 看 出 ,R 实际 上 只 与 序列 的 最 初 观察 值 a。 和 
最 末 观 察 值 a4, 有 关 , 而 与 其 他 各 观察 值 无 关 , 这 一 特点 表明 ,水平 法 旨 在 考察 现象 在 最 后 一 
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期 所 达到 的 发 展 水 平 。 因 此 ,如 果 我 们 所 关心 的 是 现象 在 最 后 一 期 应 达到 的 水 平 , 采 用 水 了 
法 计算 平均 发 展 速度 比较 合适 。 


> 8. 3. 4 平均 增 减 速度 


平均 增 减 速度 说 明 现象 逐 期 增 减 的 平均 程度 。 平 均 增 减速 度 (G) 与 平均 发 展 速度 仅 相 
差 一 个 基数 , 即 : 
G=R—1 (8-19) 
平均 增 减速 度 为 正 值 ,表明 现象 在 某 段 时 期 内 逐 期 平均 递增 的 程度 ,也 称 为 平均 递增 
率 ; 若 为 负 值 ,表明 现象 在 某 段 时 间 内 逐 期 平均 递减 的 程度 ,也 称 为 平均 递减 率 。 


> 8. 3.5 速度 指标 的 分 析 与 应 用 


对 于 大 多 数 时 间 序 列 ,特别 是 有 关 社 会 经 济 现象 的 时 间 序 列 ,我 们 经 常 利 用 速度 来 描 
述 其 发 展 的 数量 特征 。 尽 管 速度 在 计算 与 分 析 上 都 比较 简单 ,但 实际 应 用 中 ,有 时 也 会 出 
现 误 用 乃至 滥用 速度 的 现象 。 因 此 ,在 应 用 速度 分 析 实 际 问 题 时 ,应 注意 以 下 几 方 面 的 
问题 

(1) 当时 间 序 列 中 的 观察 值 出 现 0 或 负数 时 ,不 宜 计算 速度 。 比 如 ,假如 某 企 业 连 续 5 
年 的 利润 额 分 别 为 5 万 元 ,2 万 元 ,0 万 元 、 一 3 万 元 ,2 万 元 ,对 这 一 序列 计算 速度 ,要 么 不 符 
合 数学 公理 ,要 么 无 法 解释 其 实际 意义 。 在 这 种 情况 下 ,适宜 直接 用 绝对 数 进行 分 析 。 

(2) 在 有 些 情 况 下 ,不 能 单纯 就 速度 论 速度 ,要 注意 速度 与 基期 绝对 水 平 的 结合 分 析 。 

我 们 先 看 一 个 例子 。 

假定 有 两 个 生产 条 件 基本 相同 的 企业 ,各 年 的 利润 额 及 有 关 的 速度 值 见 表 8-9 。 


表 8-9 甲乙 两 个 企业 的 有 关 资 料 


甲 企业 乙 企 业 

i 利润 额 (万 元 ) 增长 率 (%) 利润 额 ( 万 元 ) 增长 率 (%) 
2013 500 60 

2014 600 20 84 40 


如 果 不 看 利润 额 的 绝对 值 . 仅 就 速度 对 甲乙 两 个 企业 进行 分 析 评 价 , 可 以 看 出 乙 企 业 
的 利润 增长 速度 比 甲 企业 高 出 1 倍 。 如 果 就 此 得 出 乙 企 业 的 生产 经 营业 绩 比 甲 企 业 要 好 得 
多 ,这 样 的 结论 就 是 不 切实 际 的 。 因 为 速度 是 一 个 相对 值 , 它 与 对 比 的 基期 值 的 大 小 有 很 大 
关系 。 大 的 速度 背后 ,其 隐 含 的 增长 绝对 值 可 能 很 小 ;小 的 速度 背后 ,其 隐 含 的 增长 绝对 值 
可 能 很 大 。 这 就 是 说 ,由 于 对 比 的 基点 不 同 , 可 能 会 造成 速度 数值 上 的 较 大 的 差异 ,进而 造 
成 速度 上 的 虚假 现象 。 上 述 例子 表明 ,由 于 两 个 企业 的 生产 起 点 不 同 ,基期 的 利润 额 不 同 ， 
才 造 成 了 二 者 速度 上 的 较 大 差异 。 从 利润 的 绝对 额 来 看 ,两 个 企业 的 速度 每 增长 1% 所 增加 
的 利润 绝对 额 是 不 同 的 。 在 这 种 情况 下 ,我 们 需要 将 速度 与 绝对 水 平 结 合 起 来 进行 分 析 , 通 
常 要 计算 增长 1% 的 绝对 值 来 弥补 速度 分 析 中 的 局 限 性 。 
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增长 1% 绝 对 值 表示 速度 每 增长 1% 而 增加 的 绝对 数量 ,其 计算 公式 为 


ees 逐 期 增长 量 前 期 水 平 
增长 1%% 绝 对 值 一 环比 坑 长 速度 义 100 100 


根据 表 8-9 的 资料 计算 , 甲 企 业 速度 每 增长 1% ,增加 的 利润 额 为 5 万 元 ,而 乙 企业 则 为 
0.6 万 元 , 甲 企 业 远 高 于 乙 企业 。 这 说 明 甲 企业 的 生产 经 营业 绩 不 是 比 乙 企业 差 ,而 是 更 好 。 


[8. 4 长 期 趋势 的 预测 | 


了 > 8. 4. 1 时间 数列 的 模型 


编制 时 间 数 列 ,进行 时 间 数 列 分 析 , 除 了 考察 现象 发 展 过 程 中 的 水 平和 速度 ,还 需要 用 
数学 模型 来 对 时 间 数 列 作 一 些 在 定性 认识 基础 上 的 定量 分 析 , 找 出 制约 现象 发 展 的 基本 因 
素 或 主要 原因 。 时 间 数 列 的 变动 主要 受 以 下 四 大 因素 的 变动 影响 : 

(1) 长 期 趋势 (T) 。 指 社会 经 济 现象 按 一 定 方向 不 断 长 期 发 展 变化 (向 上 或 向 下 发 展 ) 
的 趋势 。 

(2) 季节 变动 (S)。 指 社会 经 济 现象 随 着 季节 的 更 替 而 发 生 的 有 固定 规律 性 的 变动 。 

(3) 循环 变动 (C)。 也 称 波 浪 式 变动 , 指 反 复 高 低 变 化 的 一 种 变动 。 

(4) 偶然 变动 (T) 。 也 称 不 规则 变动 , 指 由 于 自然 或 社会 的 偶然 因素 引起 的 社会 经 济 现 
象 的 变动 。 

若 设 Y 代表 时 间 数 列 的 各 项 数值 , 则 上 述 因 素 对 时 间 数 列 的 影响 可 用 下 面 两 个 数学 模 
型 来 表示 : 
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Y=T+S+C+IRY=T*S*Cel 

其 中 最 常用 的 是 乘法 模型 。 乘 法 模型 的 基本 假设 是 ,四 个 因素 是 由 不 同 的 原因 形成 的 ， 
但 相互 之 间 存 在 一 定 的 关系 ,它们 对 事物 的 影响 是 相互 的 ,因此 时 间 序 列 中 各 观察 值 表现 为 
各 种 因素 的 乘积 。 利 用 乘法 模型 可 以 将 四 个 因素 很 容易 地 从 时 间 序 列 中 分 离 出 来 ,因而 乘 
法 模型 在 时 间 序列 分 析 中 被 广泛 应 用 。 本 节 及 之 后 各 节 介 绍 的 时 间 序 列 构成 分 析 方法 ,也 
均 以 乘法 模型 为 例 。 

长 期 趋势 是 时 间 序列 的 主要 构成 要 素 , 它 是 指 现象 在 较 长 时 期 内 持续 发 展 变化 的 一 
种 趋向 或 状态 。 通 过 对 时 间 序 列 长 期 趋势 变动 的 分 析 , 可 以 掌握 现象 活动 的 规律 性 ,并 对 
其 未 来 的 发 展 趋势 做 出 判断 或 预测 。 测 定 长 期 趋势 的 分 析 方 法 有 许多 ,如 时 距 扩 大 法 、 半 
数 平均 法 .部 分 平均 法 ,移动 平均 法 、 最 小 二 乘法 等 。 由 于 后 两 种 方法 较 常 用 , 故 主要 介绍 
移动 平均 法 和 最 小 二 乘法 。 通 过 这 两 种 方法 的 介绍 ,以 熟悉 测定 长 期 趋势 的 基本 方法 及 
各 自 的 特点 。 


>8.4.2 移动 平均 法 


移动 平均 法 是 趋势 变动 分 析 的 一 种 较 简单 的 常用 方法 。 该 方法 的 基本 思想 和 原理 是 ， 
通过 扩大 原 时 间 序 列 的 时 间 间 隔 ,并 按 一 定 的 间隔 长 度 逐 期 移动 ,分 别 计算 出 一 系列 移动 平 
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均 数 ,这 些 平均 数 形成 的 新 的 时 间 序 列 对 原 时 间 序 列 的 波动 起 到 一 定 的 修 匀 作用 ,削弱 了 原 
序列 中 短期 偶然 因素 的 影响 ,从 而 呈现 出 现象 发 展 的 变动 趋势 。 该 方法 可 以 用 来 分 析 预 测 
销售 情况 .库存 .股价 或 其 他 趋势 。 该 方法 又 可 分 为 简单 移动 平均 法 和 加 权 移 动 平 均 法 
两 种 。 


E 简单 移动 平均 法 


它 是 直接 用 简单 算术 平均 数 作为 移动 平均 趋势 值 的 一 种 方法 。 
设 移动 间隔 长 度 为 氏 , 则 移动 平均 数 序列 可 以 写 为 
Pe fea es i 
j K 
RPT, 为 移动 平均 趋势 值 ;K 为 大 于 1 小 于 的 正 整 数 。 
某 公司 2014 年 前 各 月 的 销售 额 资料 见 表 8-10, 分 别 计算 3 个 月 .5 个 月 的 移动 平均 趋势 
值 ,并 进行 比较 。 
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表 8-10 某 公司 2014 年 各 月 销售 额 单位 :万 元 

月 份 实际 销售 额 趋势 值 (k 二 3) 趋势 值 (k==5) 
1 28 

2 30 31 

3 35 34 34.4 

4 37 38 37.6 

5 42 41 41.4 

6 44 45 44.0 

7 49 47 46. 6 

8 48 49 48. 6 

9 50 50 52.4 

10 52 55 58.0 

ll 63 64 

is 77 


ARLE Thy ABS oP IY Ah k= 3 时 ,移动 平均 趋势 值 Y= 二 31;k 二 5 WY, =34. 4, ER 
各 期 同 理 ,结果 见 表 8-10. 


用 2. 加 权 移动 平均 预测 法 


这 是 在 简单 移动 平均 法 的 基础 上 给 近期 数据 以 较 大 的 权 数 ,给 远 期 的 数据 以 较 小 的 权 
数 , 计 算 加 权 移 动 平 均 数 作为 下 一 期 的 移动 平均 趋势 值 的 一 种 方法 。 公 式 为 
Yf: CY iti firi freee Yidi 
f tfeart etima 
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仍 以 表 8-10 中 的 已 知 数据 为 例 , 设 上 一 3: 则 : 


Y: ext le 32.17 


| 3. 利用 移动 平均 法 分 析 趋 势 变 动 时 要 注意 的 几 个 问题 


(1) 移动 间隔 的 长 度 应 长 短 适中 。 分 析 表 8-10 中 各 列 数据 ,不 难看 出 ,通过 移动 平均 所 
得 到 的 移动 平均 数 数 列 , 要 比 原 始 数据 序列 匀 滑 ,并 且 5 项 移动 平均 数 数列 又 比 3 项 移动 平 
均 数 数列 匀 滑 ,因此 ,为 了 更 好 地 消除 不 规则 波动 ,达到 修 匀 的 目的 ,可 以 适当 增加 移动 的 步 
长 。 移 动 的 步 长 越 大 ,所 得 趋势 值 越 少 ,个 别 观察 值 影响 作用 就 越 弱 ,移动 平均 序列 所 表现 
的 趋势 越 明显 ,但 移动 间隔 过 长 ,有 时 会 脱离 现象 发 展 的 真实 趋势 ; 若 移动 间隔 越 短 ,个 别 观 
察 值 的 影响 作用 就 越 大 ,有 时 又 不 能 完全 消除 序列 中 短期 偶然 因素 的 影响 ,从 而 看 不 出 现象 
发 展 的 变动 趋势 。 一 般 来 说 ,如 果 现 象 的 发 展 具有 一 定 的 周期 性 ,应 以 周期 长 度 为 移动 间隔 
的 长 度 。 若 时 间 序 列 是 季度 资料 ,应 采用 4 项 移动 平均 。 

(2) 在 利用 移动 平均 法 分 析 趋势 变动 时 ,要 注意 应 把 移动 平均 后 的 趋势 值 放 在 各 移动 
项 的 中 间 位 置 。 

比如 ,3 项 移动 平均 的 趋势 值 应 放 在 第 2 项 对 应 的 位 置 上 ,5 项 移动 平均 的 趋势 值 应 放 
在 第 3 项 对 应 的 位 置 上 ,其 余 类 推 。 因 此 , 若 移动 间隔 长 度 k 为 奇数 时 ,一 次 移动 即 得 趋势 
值 ; 若 人 为 偶数 时 , 需 将 第 一 次 得 到 的 移动 平均 值 再 作 一 次 2 项 移动 平均 ,才能 得 到 最 后 的 
趋势 值 。 因 此 ,该 趋势 值 也 可 以 叫 移 正 趋势 值 。 


例如 ,车 k=4 时 : 
28+30+35+37 .2.5 
+5+37+42 gg 
故 : 
y=32 4. 25 


需要 说 明 的 是 ,对 于 只 包含 趋势 和 不 规则 变动 的 数列 ,如果 移动 平均 的 目的 只 是 为 了 得 
到 数列 的 趋势 估计 值 , 也 可 以 将 移动 平均 值 直接 对 准 第 N 期 的 后 一 期 ,例如 ,三 项 移动 平均 
时 ,第 一 个 移动 平均 值 对 准 第 三 期 ,第 二 个 移动 平均 值 对 准 第 四 期 ,以 此 类 推 ; 四 项 移动 平均 
时 ,第 一 个 移动 平均 值 对 准 第 四 期 ,第 二 个 移动 平均 值 对 准 第 五 期 ,以 此 类 推 。EXCEL 中 移 
动 平 均 法 程序 即 是 这 样 处 理 的 。 


8.4.3 指数 平滑 法 


指数 平滑 法 是 用 过 去 时 间 数 列 值 的 加 权 平均 数 作为 趋势 值 , 它 是 加 权 移 动 平均 法 的 一 
种 特殊 情形 。 其 基本 形式 是 根据 本 期 的 实际 值 Y, 和 本 期 的 趋势 值 了 ,分 别 给 以 不 同 权 数 a 
和 1 一 a, 计 算 加 权 平 均 数 作为 下 期 的 趋势 值 Y,;, 。 基 本 指数 平滑 法 模型 如 下 : 


一 一 
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Yi=aY,+U—a)Y, (8-23) 


RP Y 41 表示 时 间 数 列 + 十 1 期 趋势 值 ,Y, 表 示 时 间 数 列 : 期 的 实际 值 ,Y, 表示 时 间 数 
Bil: 期 的 趋势 值 ,a 为 平滑 常数 (0 二 a 二 1)。 
若 利 用 指数 平滑 法 模型 进行 预测 ,从 基本 模型 中 可 以 看 出 ,只 需 一 个 1 期 的 实际 值 Y, ,一 


个 1 期 的 趋势 值 Y, 和 一 个 a 值 ,所 用 数据 量 和 计算 量 都 很 少 ,这 是 移动 平均 法 所 不 能 及 的 。 
K 8-11 是 某 公司 2014 年 前 8 个 月 销售 数据 ,用 指数 平滑 法 进行 长 期 趋势 分 析 。 已 知 1 
月 份 预测 值 为 150. 8 万 元 ,a 分 别 取 0.2 和 0. 8。 


表 8-11 KAA 2000 年 各 月 销售 额 预测 表 单位 :万 元 
一 次 指数 平滑 预测 数 
月 份 实际 销售 额 

a=0.2 a=0.8 
1 154 150. 80 150. 80 
2 148 151. 44 153. 36 
3 142 150. 75 149. 07 
4 151 149. 00 143. 41 
5 145 149. 40 149. 48 
6 154 148. 52 145. 90 
7 157 149. 62 152. 38 
8 151 151. 10 156. 08 
9 151. 08 152. 02 


一 次 指数 平滑 法 比较 简单 ,但 也 有 问题 ,从 表 8-11 中 也 可 看 出 ,a 值 和 初始 值 的 确定 是 
关键 ,它们 直接 影响 着 趋势 值 误差 的 大 小 。 通 常 对 于 a 和 初始 值 的 确定 可 按 以 下 方法 。 


E a 值 的 确定 


选择 a, 一 个 总 的 原则 是 使 预测 值 与 实际 观察 值 之 间 的 误差 最 小 。 从 理论 上 讲 ,a 取 
0 一 1 之 间 的 任意 数据 均 可 以 。 具 体 如 何 选 择 ,要 视 时 间 序 列 的 变化 趋势 来 定 。 

(1) 当时 间 序 列 呈 较 稳 定 的 水 平 趋势 时 ,应 取 小 一 些 , 如 0. 1 一 0. 3, 以 减 小 修正 幅度 , 同 
时 各 期 观察 值 的 权 数 差别 不 大 ,预测 模型 能 包含 更 长 时 间 序 列 的 信息 。 

(2) 当时 间 序 列 波动 较 大 时 , 宜 选 择 居中 的 a 值 ,如 0.3~0.5。 

(3) 当时 间 序 列 波动 很 大 ,呈现 明显 且 迅 速 的 上 升 或 下 降 趋势 时 ,a 应 取 大 些 , 如 0.6 一 
0. 8, 以 使 预测 模型 灵敏 度 高 些 . 能 迅速 跟 上 数据 的 变化 。 

(4) 在 实际 预测 中 ,可取 几 个 a 值 进行 试 算 , 比 较 预测 误差 ,选择 误差 小 的 那个 a 值 。 


E 初始 值 的 确定 


如 果 资 料 总 项 数 N 大 于 50, 则 经 过 长 期 平滑 链 的 推算 ,初始 值 的 影响 变 得 很 小 了 ,为 了 
简便 起 见 , 可 用 第 一 期 水 平 作 为 初始 值 。 但 是 如 果 N 小 到 15 或 20, 则 初始 值 的 影响 较 大 ， 


人 一 一 一 一 
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可 以 选用 最 初 几 期 的 平均 数 作为 初始 值 。 
指数 平滑 法 适用 于 预测 呈 长 期 趋势 变动 和 季节 变动 的 评估 对 象 。 指 数 平滑 法 可 分 为 一 
次 指数 平滑 法 和 多 次 指数 平滑 法 。 本 节 中 介绍 的 是 一 次 指数 平滑 法 的 应 用 。 


8.4.4 数学 曲线 拟 合 法 


假定 有 一 个 多 年 的 数据 序列 ,为 了 算出 逐年 的 趋势 值 ,可 以 考虑 对 原始 数据 拟 合 一 条 数 
学 曲线 。 例 如 ,假如 趋势 是 线性 的 ,就 可 以 用 最 小 平方 法 拟 合 直线 方程 ;如 果 趋 势 是 指数 曲 
线 型 的 , 则 可 考虑 拟 合 指数 曲线 方程 。 在 用 数学 曲线 拟 合 法 测定 趋势 值 时 首先 要 解决 的 问 
题 是 曲线 方程 的 选择 。 选 择 曲线 方程 有 两 个 途径 :一 是 在 以 时 间 : 为 横 轴 ,变量 Y 为 纵 轴 的 
直角 坐标 图 上 作 时 间 序 列 数值 的 散 点 图 ,根据 散 点 的 分 布 形状 来 确定 应 拟 合 的 曲线 方程 ;二 
是 对 时 间 序 列 的 数值 作 一 些 分 析 ,根据 分 析 的 结果 来 确定 应 选择 的 曲线 方程 。 选 择 合适 的 
方程 ,是 评估 人 员 在 分 析 预 测 时 应 特别 注意 的 问题 。 下 面 我 们 结合 一 些 典 型 和 常用 的 趋势 
曲线 来 讨论 曲线 方程 的 选择 和 拟 合 。 


[i 直线 趋势 的 拟 合 


根据 线性 函数 的 特性 ; 
AY, =Y, Y, =a +b(t+1)—a—bt=b 
如 果 一 个 多 年 的 数据 序列 ,其 相 邻 两 年 数据 的 一 阶 差 近似 为 一 常数 ,就 可 以 配合 一 直 
BY, =a Hot IRI A ETT ERRE abo 
由 所 求 的 趋势 线 ya tbe. HER AE 
So p? Mo a—tt)? 二 最 小 值 
在 上 式 中 ,t 代表 时 间 ;a 代表 直线 趋势 方程 的 起 点 值 ;b 代表 直线 趋势 方程 的 斜率 , 即 1 
每 变动 一 个 单位 时 ,长 期 趋势 值 增加 (或 减少 ) 的 数值 。 
令 Q= Diya — 4)? ,为 使 其 最 小 , 则 对 和 2 的 偏 导 数 应 等 于 0, 整理 得 : 


Sy = ma +6bD x 
Sey = adjrtb>)2 


(8-24) 


解 得 : 
pic ndyty— Dz Dy 
aD = (Xa) 
a = ġy— br 
其 中 ,n 代表 时 间 的 项 数 ,5 = D y/n,z = Dd) x/n ,其 他 符号 所 代表 的 意义 不 变 。 
在 对 时 间 数 列 按 最 小 二 乘法 进行 趋势 配合 的 运算 时 ,为 使 计算 更 简便 些 ,将 各 年 份 (或 
其 他 时 间 单位 ) 简 记 为 1,2,3.4,…, 并 用 坐标 移 位 方法 将 原点 O 移 到 时 间 数 列 的 中 间 项 ,使 
Dye = 0 。 当 项 数 ”为 奇数 时 ,中 间 项 为 0, 当 为 偶数 时 ,中 间 的 两 项 分 别 设 一 1,1 这 样 问 隔 
便 为 2, 各 项 依次 设 成 :… 一 5. 一 3, 一 1;1,3.5,…。 这 样 求解 公式 便 可 简化 为 
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I 


Sy = na a= Dy/n=5 


> (8-25) 
Say =b) t b= Day/ De 
表 8-12 是 某 游览 点 历年 观光 游客 资料 ,用 最 小 平方 法 进行 长 期 趋势 分 析 如 下 。 
表 8-12 某 游览 点 历年 观光 游客 的 最 小 二 乘法 计算 表 
年 份 时 间 上 上 游客 (百人 )y 并 ty ye 
1994 1 100 | 100 99. 08 
1995 2 112 4 224 112. 72 
1996 3 125 9 375 126. 36 
1997 4 140 16 560 140. 00 
1998 5 155 25 115 153. 64 
1999 6 168 36 1 008 167. 28 
2000 7 180 49 1 260 180. 92 
& H 28 980 140 4 302 980, 00 


由 表 8-12 得 ,2》)t = 28, X y = 980, D e = 140, X ty = 4 302, 代 人 公式 得 : 
_ 7X4 302—28X980_2 674 __ 
7X140—28%28 196 
a=980/7—13. 64X4=140—54. 56=85. 44 

从 而 求 得 直线 趋势 方程 为 : 


b 13. 64 


y=85. 44+13. 64t 
把 各 1 值 代入 上 式 , 便 求 得 相对 应 的 趋势 值 y, 见 表 8-12 的 右 栏 。 这 里 需要 指出 的 是 : 
对 表 8-12 的 游客 历年 数 用 直线 趋势 配合 ,是 因为 各 年 的 逐 期 增长 量 大 体 相 当 , 具 备 了 直线 
型 时 间 数 列 的 特征 。 表 8-13 是 同一 资料 按 简捷 公式 计算 得 出 的 结果 。 
表 8-13 某 游览 点 历年 观光 游客 的 最 小 二 乘法 计算 表 ( 按 简捷 公式 计算 ) 


年 份 时 间 t 游客 (百人 )y ty ye 
1994 -8 100 9 一 300 99. 08 
1995 —2 112 4 一 224 112. 72 
1996 一 二 125 1 — 186 126. 36 
1997 0 140 0 0 140. 00 
1998 1 155 1 155 153. 64 
1999 2 168 4 336 167. 28 
2000 3 180 9 540 180. 92 
合计 0 980 28 382 980. 00 
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由 简捷 公式 得 : 


即 : 
yc=140 十 13. 64t 

将 各 + 值 代入 上 式 , 便 求 得 各 年 的 趋势 值 yeo 

最 小 二 乘法 在 对 原 数 列 作 长 期 趋势 的 测定 时 ,通过 趋势 值 y. 来 修 匀 原 数 列 ,得 到 比较 接 
近 原 值 的 趋势 值 。 利 用 所 求 的 直线 趋势 方程 还 能 对 近期 的 数列 做 出 预测 ,例如 ,根据 表 8-16 
求 出 直线 趋势 方程 ,代入 :一 4, 便 能 预测 2001 年 的 游客 人 数 , 即 . 

y. 二 140 十 13. 64X4=194. 56( 百 人 ) 

特别 要 提醒 注意 的 是 ,这 里 的 直线 方程 Y= a 十 tt, 不 涉及 变量 1 与 变量 Y 之 间 的 任何 因 
果 关 系 ,也 没有 考虑 误差 的 任何 性 质 , 因 此 它 仅 仅 是 一 个 直线 拟 合 公式 ,并 不 是 什么 回归 模型 。 
还 需要 指出 的 是 ,作为 较 长 期 的 一 种 趋势 ,利用 所 拟 合 的 数学 方程 式 进行 预测 时 ,必须 假定 趋 
势 变 化 的 因素 到 预测 年 份 仍然 起 作用 。 注 意 ,由 于 例题 只 是 为 了 说 明 分 析 计 算 的 方法 ,因此 为 
简便 起 见 ,一 般 选 用 的 数据 都 比较 少 , 实 际 应 用 时 ,数据 应 丰富 些 方 能 更 好 地 反映 长 期 趋势 。 


B 指数 趋势 线 的 拟 合 


由 于 指数 曲线 具有 如 下 特性 : 


上 wi Yam _ abl 
Y=Y,=ab' Y, “abt, =b 
t ab’ 


因此 ,当时 间 序 列 的 各 期 数值 大 致 按 某 一 相同 比率 增长 时 ,可 以 考虑 配合 指数 方程 。 联 
系 常用 的 复 利 公 式 : P,= P。 (1 十 >) , 令 :Y,=P,a=Po,0 一 1 十 rz 一刀 则 复 利 公式 与 指数 
方程 完全 一 致 ,可 见 指数 曲线 是 一 种 常用 的 典型 趋势 线 。 

例如 , 某 企 业 2009~ 2014 年 的 销售 量 依次 为 53、72、96、129、171、232 万 件 , 试 求 该 企业 
销售 量 的 长 期 趋势 。 

解 :由 于 这 个 时 间 序 列 的 环比 序列 为 

Y,/Y¥,=72/53=1. 358, Y;/Y2=96/72=1. 333,Y,/Ys=129/96=1. 344, 

Y3/Y,=171/129=1. 326, Y/Y; =232/171=1. 357 

即 各 年 产量 几乎 按 同 一 比例 增长 ,所 以 ,可 以 考虑 拟 合 指数 曲线 Y =a 。 

首先 将 上 式 转 换 为 直线 方程 , 取 对 数 InY 二 lna 十 bt, 令 Y =InY,a 二 lna, 然 后 利用 最 小 
平方 法 求解 参数 。 具 体 计 算 见 表 8-14 所 示 。 

表 8-14 指数 趋势 函数 计算 表 


年 份 序号 4 a ¥ Y’=InY tY MAY, 
1995 1 1 53 3. 97 3.97 53. 79 
1996 2 4 72 4. 23 8. 55 71. 89 
1997 3 9 96 4.56 13.69 96. 07 
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SER 
年 份 序号 上 e Y Y’=1nY x TAMA Y, 
1998 4 16 129 4. 86 19. 44 128. 39 
1999 5 25 171 5.14 25.71 171.59 
2000 6 36 232 5.45 32. 68 229. 32 
合计 21 91 一 28. 26 104. 04 一 
根据 上 面 的 结果 ,有 

Be 2 
n S = ( Dt) 


a’ = Y' — bt = 3. 695 
a=e = 40.25 
此 得 到 产量 的 长 期 趋势 函数 为 Y==40. 250%", ¢ RANER 2009 ~ 2014 年 销 
售 量 的 趋势 值 。 若 要 预测 2015 年 产量 , 则 有 
Faam 40. 2 一 806. 47( FF) 


8.5 ”季节 变动 、 循 环 变 动因 素 分 析 


季节 变动 是 指 一 些 现象 由 于 受 自 然 条 件 或 经 济 条 件 的 影响 在 一 个 年 度 内 随 着 季节 的 更 
替 而 发 生 比较 有 规律 的 变动 ,例如 ,农产品 的 生产 量 . 某 些 商 品 的 销售 量 等 ,都 会 因 时 间 的 变 
化 而 分 为 农忙 农闲 ,淡季 旺季 。 季 节 变 动 往 往 会 给 社会 生产 和 人 们 的 经 济 生活 带 来 一 定 影 
响 。 研 究 季节 变动 ,就 是 为 了 认识 这 些 变 动 的 规律 性 ,以 便 更 好 地 安排 .组 织 社会 生产 与 
生活 。 

测定 季节 变动 的 方法 从 是 否 排除 长 期 趋势 的 影响 看 ,可 分 为 两 种 :一 是 不 排除 长 期 趋势 
的 影响 ,直接 根据 原 时 间 数 列 来 测定 ;二 是 依据 消除 长 期 趋势 后 的 时 间 数 列 来 测定 。 前 者 常 
用 简单 平均 法 ,后 者 常用 移动 平均 趋势 剔除 法 。 但 是 ,不 管 采 用 哪 种 方法 ,都 需 具 备 连 续 多 
年 的 各 月 ( 季 ) 资 料 ,以 保证 所 求 的 季节 比率 具有 代表 性 ,从 而 能 比较 客观 地 描述 现象 的 季节 
变动 。 现 将 两 种 测定 方法 介绍 如 下 。 


8.5.1 季节 变动 测定 方法 


E 简单 平均 法 


根据 月 ( 季 ) 的 时 间 数 列 , 用 简单 平均 法 测定 季节 变动 的 计算 步骤 如 下 : 
(1) 分 别 就 每 年 各 月 、( 季 ) 的 数值 加 总 后 ,计算 各 年 的 月 ( 季 ) 的 平均 数 。 
D 将 各 年 同月 ( 季 ) 的 数值 加 总 ,计算 若干 年 内 同月 ( 季 ) 的 平均 数 。 
(3) 根据 若干 年 内 每 个 月 的 数值 总 计 , 计 算 若 干 年 总 的 月 ( 季 ) 平 均 数 。 
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(4) 将 若干 年 内 同月 ( 季 ) 的 平均 数 与 总 的 月 ( 季 ) 平 均 数 相 比 , 即 求 得 用 百分数 表示 的 
各 月 ( 季 ) 的 季节 比率 ,又 可 以 称 为 季节 指数 。 


表 8-15 “ 某 商店 某 商品 销售 量 的 季节 变动 分 析 单位 : 百 件 
1A |2 | 3H | 4A |358 |68 | TH | 总 月 |98 |DA |18 |R|] FY 
2011 40 | 34 | 36 | 34 | 35 | 32 | 28 | 34 | 34 | 37 | 38 | 40 | 35.17 
2012 38 | 32 | 40 | 32 | 32 | 30 | 30 | 33 | 36 | 36 | 36 | 42 | 34.75 
2013 32 | 36 | 37 | 31 | 31 | 29 | 31 | 33 | 32 | 35 | 37 | 52 | 34.67 
2014 30 | 26 | 35 | 29 | 30 | 28 | 28 | 33 | 32 | 32 | 35 | 36 | 31.17 
合计 140 | 128 | 148 | 126 | 128 | 119 | 117 | 133 | 134 | 140 | 146 | 170 | 1629 
月 平均 35 | 32 | 37 |31.5| 32 |29.75|29.25|33.25| 33.5| 35 | 36.5 | 42.5 |33.937 5 
季节 比率 %|103. 13/94. 29|109. 02} 92. 82|94. 29|87. 66|86. 19|97. 97| 98.71|103. 13107. 55l125. 23) 100. 00 


由 表 8-15 的 资料 可 知 , 某 商店 某 商品 销售 的 季节 比率 以 12 月 的 125. 23% 为 最 高 ,2 月 
的 109.02% 为 其 次 ;而 以 7 月 的 86.19% 为 最 低 ,6 月 的 87. 66% 为 次 低 。 


,一 月 份 菜 商品 销售 平均 数 

月 份 季节 比率 一 否 月 平均 商品 销售 平均 数 

ass: 100% =103. 13% 

其 余 各 月 的 季节 比率 依次 类 推 。 至 于 表 8-15 右 下 角 的 100% 是 将 各 月 的 季节 比率 加 总 


后 除 一 年 的 12 个 月 份 数 求 得 的 。 


|) 2. 移动 平均 趋势 别 除 法 


移动 平均 趋势 剔除 法 是 利用 移动 平均 法 先 消除 原 时 间 数 列 中 的 长 期 趋势 的 影响 ,然后 
再 来 测定 它 的 季节 变动 ,其 计算 步骤 及 方法 如 下 : 

(1) 根据 时 间 数 列 中 各 年 按 月 ( 季 ) 的 数值 计算 其 12 个 月 的 (若是 季 资 料 则 为 4 个 季 的 ) 
移动 平均 数 。 

由 于 是 偶数 项 移动 平均 ,趋势 值 y. 要 分 两 步 求 得 。 

(2) 用 时 间 数 列 中 各 月 ( 季 ) 的 数值 (y) 与 其 相对 应 的 趋势 值 (y.) 对 比 ,计算 y/y. 的 百 分 


比 数值 。 
(3) 把 >/y 的 百分比 数值 按 月 ( 季 ) 排 列 , 计 算出 各 年 同月 ( 季 ) 的 总 平均 数 ,这 个 平均 数 
就 是 各 月 ( 季 ) 的 季节 比率 。 


(4) 把 各 月 ( 季 ) 的 季节 比率 加 起 来 ,其 总 计数 应 等 于 1 200%( 若 为 季 资 料 其 总 计数 应 
等 于 400% ) ,如 果 不 符 , 还 应 把 1200% 与 实际 加 总 的 各 月 季节 比率 相 比 求 出 校正 系数 ,把 校 
正 系 数 分 别 乘 上 各 月 的 季节 上 比率。 这样 求 得 的 季节 比率 就 是 一 个 剔除 了 长 期 趋势 影响 后 的 
季节 比率 。 

显然 ,季节 变动 分 析 中 的 两 种 方法 各 有 特点 ,前 者 计算 简便 ,但 所 求 出 的 季节 比率 包含 
长 期 趋势 的 影响 。 后 者 计算 较 繁 ,但 却 得 到 了 一 个 反映 现象 发 展 过 程 中 的 季节 变动 的 缩 
影 一 一 剔除 长 期 趋势 后 的 季节 比率 。 
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8.5.2 循环 变动 的 测定 


循环 变动 各 个 时 期 有 不 同 的 原因 ,变动 的 程度 也 有 自己 的 特点 ,这 和 季节 变动 基于 大 体 
相同 的 原因 和 相对 稳定 的 周期 形成 对 照 , 所 以 不 能 用 测定 季节 变动 的 方法 来 研究 循环 变动 。 
通常 用 剩余 法 测定 循环 变动 的 程度 。 基 本 思想 是 :对 各 期 时 间 数 列 资料 用 长 期 趋势 和 季节 
比率 消除 趋势 变动 和 季节 变动 ,而 得 反映 循环 变动 与 不 规则 变动 的 数列 ,然后 再 采用 移动 平 
均 法 消除 不 规则 变动 , 便 可 得 出 反映 循环 变动 程度 的 各 期 循环 变动 系数 。 

Y=T-S«C+«f 
¥ Fe Se oF 
TS TS 

将 C， I 数列 进行 移动 平均 修 匀 , 则 修 匀 后 的 数列 即 为 各 期 循环 变动 的 系数 。 

测定 循环 变动 的 程度 ,认识 经 济 波动 的 某 些 规律 ,预测 下 一 个 循环 变动 可 能 产生 的 各 种 
影响 ,以 便 充分 利用 有 利 因素 ,避免 不 利 因素 ,对 于 保持 国民 经 济 持续 稳定 的 发 展 有 重要 的 
意义 。 但 是 循环 变动 预测 和 长 期 趋势 预测 不 同 ,循环 变动 主要 属于 景气 预测 ,在 很 大 程度 上 
要 依靠 经 济 分 析 , 仅 仅 对 历史 资料 的 统计 处 理 是 不 够 的 。 


F 


=ef 
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Excel 在 时 间 序 列 分 析 中 的 示例 


Excel 在 “数据 分 析 ” 选 项 中 提供 了 三 种 时 间 序 列 计算 方法 , 即 常 用 的 移动 平均 法 、 指 数 
平滑 法 和 回归 法 ,利用 这 些 方法 可 以 计算 出 估计 值 ,标准 差 , 残 差 和 拟 合 图 。 同 时 ,如 果 配 合 
使 用 Excel 的 “数据 分 析 ” 选 项 功能 可 以 完成 数学 曲线 拟 合法 。 

一 ,移动 平均 法 

以 本 章 表 8-10 的 数据 为 例 , 相 关 移 动 平均 宏 计 算 移 动 平均 趋势 的 过 程 如 下 : 

(1) 第 一 步 ,在 Excel 工作 表 B2:B13 区 域 中 输入 * 某 公司 2000 年 各 月 销售 额 * 资 料 。 

O) 第 二 步 ,在 Excel “工具 栏 ” 菜 单 中 选择 “数据 分 析 ” 选 项 ,并 单 击 “ 移 动 平均 ”。 

G) 在 移动 平均 菜单 的 “输入 区 域 " 中 输入 B1:Bl13 ,在 “间隔 ”中 输入 3 表示 进行 3 项 移 
动 平均 ,选择 “输出 区 域 ”, 并 选择 输出 为 “图 表 输 出 "和 “标准 差 " 输 出 ,最 后 单 击 “ 确 定 ” 按 钮 。 
如 图 8-1 所 示 。 

图 8-1 分 别 产生 了 3 项 移动 平均 的 估计 值 C4:C13 和 估计 的 标准 差 D6:D12。 正 如 图 8- 
1 中 C4 单元 格 的 表达 式 所 示 ,C4 中 的 表达 式 二 AVERAGE(B2:B4) 是 对 B2:B4 单元 计算 
算术 平均 数 ,而 D6 单元 格 中 的 表达 式 =SQRTCSUMXMY2(B4:B6.C4:C6)/3) 相 当 于 标准 


ZA: 
g= [>> es 


KF Excel 中 的 “移动 平均 ”的 计算 ,需要 说 明 两 点 : 
一 是 图 例 说 明 中 的 “趋势 值 ”. 即 移动 平均 值 .由 于 移动 平均 法 是 以 移动 平均 值 作为 趋势 


估计 值 ,因此 也 将 其 称 为 趋势 值 ” 的 。 
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3. 696846 
3. 366502 
3. 696846 
2. 94392 
2. 44949 
1. 414214 
4. 795832 
64) 3. 888194 


图 8-1 计算 结果 


二 是 移动 平均 值 的 位 置 不 是 在 被 平均 的 N 项 数值 的 中 间 位 置 ,而 是 直接 排放 在 这 N 
个 时 期 的 最 后 一 期 ,这 一 点 与 通常 意义 上 移动 平均 值 应 排放 在 N 时 期 的 中 间 时 期 有 所 
不 同 。 

图 还 绘制 出 实际 观察 值 与 3 项 移动 平均 估计 值 之 间 的 拟 合 曲线 ,可 以 看 出 ,移动 平均 值 
削弱 了 上 下 波动 ,如 果 这 种 波动 不 是 季节 波动 而 是 不 规则 变动 的 话 , 显 然 ,移动 平均 可 以 削 
弱 不 规则 变动 。 对 于 该 例 进行 4 项 移动 平均 的 结果 与 3 项 移动 角 明 显 不 同 。 也 就 是 说 , 当 
数列 有 季节 周期 时 ,只 要 移动 平均 的 项 数 和 季节 波动 的 周期 长 度 一 致 , 则 移动 平均 值 可 以 消 
除 季节 周期 ,并 在 一 定 程度 上 消除 不 规则 变动 ,从 而 揭示 出 数列 的 长 期 趋势 。 这 一 点 我 们 将 
在 季节 摆动 分 析 中 具体 讨论 。 

二 ,指数 平滑 法 

仍 以 表 8-11 中 的 数据 为 例 , 相 关 指 数 平滑 法 宏 计算 过 程 如 下 : 

(1) 在 Excel “工具 栏 "* 中 选择 “数据 分 析 ” 选 项 ,并 单 击 “ 指 数 平滑 ”过 程 。 

(2) 在 “指数 平滑 ? 宏 菜 单 的 “输入 区 域 " 中 输入 B2:B13, 在 “阻尼 系数 ”输入 0. 35。 如 图 
8-2 所 示 。 

G) 选择 “输出 区 域 ”, 并 选择 输出 为 “图 表 输出 ”和 “标准 差 " 输 出 , 单 击 “ 确 定 ”, 移 动 平 
均 的 计算 结果 如 图 8-3 所 示 。 

三 ,数学 曲线 拟 合法 

在 Excel 中 虽 没 有 提供 数学 曲线 拟 合法 的 直接 计算 工具 ,但 是 通过 配合 使 用 某 些 宏 与 
函数 可 以 完成 直线 或 曲线 趋势 的 数学 拟 合 。 下 面 介绍 直线 趋势 的 拟 合 。 

利用 图 形 向 导 和 添加 趋势 线 可 以 完成 直线 趋势 的 数学 拟 合 。 其 具体 过 程 如 下 : 

(1) 首先 ,利用 图 形 向 导 生 成 折线 图 或 利用 移动 平均 宏 生成 折线 图 。 

(2) 其 次 ,在 对 生成 的 草图 进行 必要 的 修饰 后 ,得 到 时 序 图 。 单 击 鼠 标 左 键 选择 折线 ， 
然后 单 击 鼠 标 右键 ,选择 “添加 趋势 线 ” 操 作 , 如 图 8-4 所 示 。 

(3) 最 后 ,在 “添加 趋势 线 ” 操 作 中 ,选择 “线性 ”趋势 线 , 如 图 8-5 所 示 , 然 后 单 击 “ 选 项 ” 
菜单 ,在 “选项 "菜单 中 选择 输出 “显示 公式 "和 “显示 R 平方 值 ? 两 项 ,如 图 8-6 所 示 。 然 后 单 
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42 35. 60175| 4. 181309 
44 39. 76061| 5. 45856. 
49 42. 51621| 4. 995666. 
48 46. 73068| 5. 800847. 
50 47. 55574| 4. 532221. 
52 49. 14451| 4. 067148. 
63 51. 00058| 2. 29052. 

8. 80024 7. 259807 


图 8-3 计算 结果 
击 “ 确 定 ”, 得 到 如 图 8-7 所 示 趋 势 线 和 直线 趋势 方程 及 RR 平方 值 。 
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本 项 目 介绍 了 时 间 序 列 分 析 和 预测 的 基本 方法 。 首 先 ,我 们 说 明了 通过 绘制 时 间 序 列 
图 来 确定 时 间 序 列 的 基本 模式 。 数 据 模式 可 分 为 几 种 类 型 ,包括 水 平 模式 ,趋势 模式 和 季节 
模式 。 以 时 间 序 列 所 呈现 的 这 些 模式 为 依据 ,讨论 了 预测 方法 。 

在 不 同时 期 和 时 点 数列 下 ,平均 发 展 水 平和 速度 发 展 指标 有 不 同 的 计算 方法 。 相 对 发 
展 水 平 是 了 解 和 观察 研究 对 象 发 展 变化 特点 的 一 个 重要 指标 。 

对 水 平 模式 的 时 间 序 列 ,我 们 说 明了 如 何 用 移动 平均 法 和 指数 平滑 法 进行 预测 。 移 动 
平均 法 计算 数据 值 的 平均 值 ,然后 用 这 个 平均 数 作 为 下 一 个 时 期 的 预测 值 。 在 指数 平滑 法 


Q 
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图 8-4 添加 趋势 线 
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图 8-5 选择 “线性 "趋势 线 


中 ,我们 用 时 间 序 列 数值 的 加 权 平均 数 来 计算 预测 值 。 当 水 平 模式 移动 到 不 同 的 水 平 模式 
时 ,这 些 方法 也 同样 适用 。 

本 项 目 还 介绍 了 如 何 用 时 间 序 列 分 析 方法 将 一 个 时 间 序 列 分 隔 或 分 解 为 季节 和 趋势 成 
分 ,然后 得 到 消除 季节 影响 的 时 间 序 列 。 还 介绍 了 如 何 计算 一 个 乘法 模型 的 季节 指数 ,如 何 用 
季节 指数 得 到 消除 季节 影响 的 时 间 序列 ,以 及 如 何 对 消除 季节 影响 的 数据 使 用 趋势 方程 来 估计 
趋势 成 分 。 当 趋势 和 季节 成 分 同时 存在 时 ,建立 预测 的 最 后 一 步 是 用 季节 指数 调整 趋势 推测 值 。 
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图 表 标题 y = 1.7214x + 10.543 


图 8-7 输出 结果 


1. 某 种 股票 2014 年 各 统计 时 点 的 收盘 价 见 表 8-16 ,计算 该 股票 的 年 平均 价格 。 


表 8-16 题 1 表 
统计 时 点 1 月 1 日 3 月 1 日 7 月 1 日 10 月 1 日 12 月 31 日 
收盘 价 (元 ) 15:2 14.2 17.6 16.3 15.8 
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2. 某 企 业 2014 年 9 一 12 月 末 职 工人 数 资料 见 表 8-17。 
表 8-17 题 2 表 
日 期 9 月 30 日 10 月 31 日 11 月 30 日 12 月 31 日 


月 末 人 数 ( 人 数 ) 1 400 1510 1 460 1 420 


计算 该 企业 第 四 季度 的 平均 职工 人 数 。 
3. 某 公 司 2009~ 2014 年 各 年 底 职 工人 数 和 工程 技术 人 员 数 据 见 表 8-18. 


表 8-18 题 3 表 


年 份 2009 2010 2011 2012 2013 2014 
职工 人 数 1 000 1 020 1 085 1 120 1 218 1 425 
工程 技术 人 员 50 50 52 60 78 82 


试 计算 工程 技术 人 员 占 全 部 职工 人 数 的 平均 比重 。 
4. 某 企 业 2014 年 第 四 季度 各 月 产值 和 职工 人 数 见 表 8-19, 试 计算 该 季度 平均 劳动 生 


产 率 。 
表 8-19 题 4 表 
月 份 10 H 11 月 ] 多 月 
产值 (元 ) 400 000 46 200 494 500 
平均 职工 人 数 ( 人 ) 400 420 430 
月 平均 劳动 生产 率 ( 元 ) 1 000 1 100 1 150 


5. 某 化 工 企业 2010~2014 年 的 产量 资料 见 表 8-20。 


表 8-20 题 5 表 
年 份 2010 2011 2012 2013 2014 
产量 (万 吨 ) 400 484 
环比 增长 速度 (%) 5 12:5 
定 基 发 展 速度 (%) mag 


利用 指标 间 关 系 将 表 中 所 缺 数字 补 充 。 
6. 某 地 区 2005~2014 年 粮食 总 产量 见 表 8-21, 


表 8-21 题 6 R 


年 份 2005 | 2006 | 2007 | 2008 | 2009 | 2010 | 2011 2012 2013 | 2014 


产量 (万 吨 ) | 230 236 241 246 252 257 262 276 281 286 
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项 目 8 时间 序列 分 析 及 预测 
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(1) 绘制 数据 散 点 图 。 


(2) 根据 散 点 图 观察 该 地 区 粮食 产量 趋势 是 否 接近 于 直线 型 ? 
(3) 根据 散 点 图 画 一 条 与 所 有 观察 值 距离 最 近 的 直线 ,用 最 小 平方 法 写 出 直线 趋势 方程 。 
(4) 根据 趋势 方程 , 试 预测 2015 年 的 粮食 产量 。 
7. 某 专卖 店 2012~2014 年 各 季度 销售 额 资 料 见 表 8-22. 


表 8-22 题 7 表 


年 份 一 季度 二 季度 三 季度 四 季度 
2012 51 75 87 54 
2013 65 67 82 62 
2014 76 77 89 73 


(1) 采用 按 季 平均 法 .移动 平均 趋势 剔除 法 计算 季节 指数 。 
(2) 计算 2014 年 无 季节 变动 情况 下 的 销售 额 。 


$ v 


海南 Vintage 海 景 酒店 是 一 家 专门 经 营 海鲜 的 五 星 级 餐饮 企业 ,开业 三 年 来 ,已 在 行业 
中 取得 良好 声誉 。 为 了 更 好 地 规划 酒店 未 来 发 展 ,管理 人 员 需 要 建立 一 个 系统 以 提前 一 年 
预测 食品 和 饮料 的 每 个 月 的 销售 额 。 表 8-23 是 酒店 开业 前 3 年 的 食品 和 饮料 的 销售 额 ( 单 


位 :万 元 ) 数 据 。 
表 8-23 酒店 开业 前 3 年 的 食品 和 饮料 的 销售 额 
月 份 第 一 年 第 二 年 第 三 年 月 份 第 一 年 第 二 年 第 三 年 
1 242 263 282 7 145 157 166 
2 235 238 255 8 152 161 174 
3 232 247 265 9 110 122 126 
4 178 193 205 10 130 130 148 
5 184 193 210 11 152 167 173 
6 140 149 160 12 206 230 235 


对 酒店 的 销售 额 数据 进行 分 析 , 请 为 Vintage 海景 酒店 准备 一 份 报告 ,该 报告 总 结 了 


的 发 现 、 预 测 和 建议 ,主要 包括 以 下 内 容 : 


(1) 时 间 序 列 图 。 对 时 间 序 列 的 基本 模式 做 出 判断 。 


你 


(2) 数据 的 季节 性 分 析 。 计 算 每 个 月 的 季节 指数 ,并 对 季节 性 的 高 销售 月 和 低 销售 月 


做 出 判断 。 季 节 指 数 是 否 具有 直观 上 的 意义 ? 请 讨论 。 


(3) 消除 时 间 序 列 的 季节 影响 。 在 消除 季节 影响 的 时 间 序 列 中 ,是 否 显现 出 任何 


趋势 ? 
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(4) 利用 时 间 序 列 分 解法 ,预测 第 四 年 1 一 12 月 的 销售 额 。 

(5) 利用 回归 分 析 方 法 ,预测 第 四 年 1 一 12 月 的 销售 额 。 

(6) 在 你 的 报告 中 ,给 出 你 的 计算 汇总 数据 和 图 。 

假设 第 四 年 1 月 的 实际 销售 额 为 295 000 元 ,你 的 预测 误差 是 多 少 ? 如果 这 个 误差 比较 
大 ,管理 层 可 能 会 对 你 的 预测 值 和 实际 销售 额 之 间 的 差异 产生 疑惑 ,你 将 如 何 消除 管理 层 对 
预测 方法 的 怀疑 ? 请 结合 相关 内 容 和 你 的 分 析 给 出 合理 解释 。 
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>> > | 实践 中 的 统计 


中 国 制 造 业 采 购 经 理 指数 


2018 年 12 月 份 ,中 国 制造 业 采 购 经 理 指数 (PMI) 为 49.4%, 比 上 月 回落 0.6 个 百 分 
点 , 低 于 临界 点 ,制造 业 景气 度 有 所 减弱 。 


(%) 50%= 与 上 月 比较 无 变化 
54 
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图 9-1 制造 业 PMI 指数 (经 季节 调整 ) 

从 企业 规模 看 ,大 型 企业 PMI 为 50.1%, 比 上 月 回落 0.5 个 百分点 , 微 高 于 临界 点 ;中 、 
小 型 企业 PMI 为 48.4% 和 48.6 唤 ,分别 比 上 月 下 降 0.7 和 0.6 个 百分点 , 均 位 于 临界 点 
以 下 。 

从 分 类 指数 看 ,在 构成 制造 业 PMI 的 5 个 分 类 指数 中 ,生产 指数 和 供应 商 配 送 时 间 指 
数 高 于 临界 点 ,新 订单 指数 、 原 材料 库存 指数 和 从 业 人 员 指 数 低 于 临界 点 。 

生产 指数 为 50.8%, 比 上 月 回落 1.1 个 百分点 ,高 于 临界 点 ,表明 制造 业 生 产 继续 保持 
增长 。 

新 订单 指数 为 49.7%, 比 上 月 下 降 0.7 个 百分点 ,位 于 临界 点 之 下 ,表明 制造 业 企 业 产 
品 订货 量 有 所 减少 。 

原材料 库存 指数 为 47.1%, 比 上 月 下 降 0. 3 个 百分点 ,位 于 临界 点 之 下 ,表明 制造 业主 
要 原材料 库存 降幅 有 所 扩大 。 

从 业 人 员 指 数 为 48.0%, 比 上 月 下 降 0.3 个 百分点 ,位 于 临界 点 之 下 ,表明 制造 业 企 业 
用 工 量 有 所 减少 。 

供应 商 配送 时 间 指 数 为 50.4%, 比 上 月 上 升 0. 1 个 百分点 ,高 于 临界 点 ,表明 制造 业 原 
材料 供应 商 交 货 时 间 继 续 加 快 。 

见 表 9-1 所 示 。 
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表 9-1 中 国 制造 业 PMI 及 构成 指数 (经 季节 调整 ) 单位 :% 
iis PMI 分 类 指数 
生产 新 订单 原材料 库存 | 从 业 人 员 | 供应 商 配送 时 间 
2017 年 12 月 51.6 54. 0 53. 4 48.0 48.5 49.3 
2018 年 1 月 51.3 53.5 52.6 48.8 48.3 49.2 
2018 年 2 月 50.3 50.7 51.0 49.3 48.1 48. 4 
2018 46 3 H 51.5 53.1 53.3 49.6 49. 1 50. 1 
2018 年 4 月 51.4 53.1 52.9 49.5 49.0 50. 2 
2018 45 H 51.9 54.1 53.8 49.6 49.1 50. 1 
2018 4F 6 H 51.5 53. 6 oe 48.8 49.0 50. 2 
2018 年 7 月 ei: 2 53.0 52. 3 48.9 49.2 50. 0 
2018 4F 8 H 51.3 53.3 52.2 48.7 49.4 49. 6 
2018 年 9 月 50. 8 53.0 52.0 47.8 48.3 49.7 
2018 年 10 月 50. 2 52.0 50. 8 47.2 48.1 49.5 
2018 46 11 H 50. 0 51.9 50. 4 47.4 48.3 50. 3 
2018 4F 12 月 49.4 50.8 49.7 47.1 48. 0 50. 4 


采购 经 理 指数 (PMI) ,是 通过 对 企业 采购 经 理 的 月 度 调查 结果 统计 汇总 、 编 制 而 成 的 指 
数 , 它 涵盖 了 企业 采购 .生产 流通 等 各 个 环节 ,包括 制造 业 和 非 制 造 业 领域 ,是 国际 上 通用 
的 监测 宏观 经 济 走势 的 先行 性 指数 之 一 ,具有 较 强 的 预测 、 预 警 作用 。 综 合 PMI 产 出 指数 
是 PMI 指标 体系 中 反映 当期 全 行业 (制造 业 和 非 制 造 业 ) 产 出 变化 情况 的 综合 指数 。PMI 
通常 以 50% 作 为 经 济 强 弱 的 分 界 点 ,PMI 高 于 50% 时 ,反映 经 济 总 体 扩张 ; 低 于 50%, 则 反 
映 经 济 总 体 收缩 。 


[9. 1 指数 的 概念 和 分 类 | 


b 9. 1.1 指数 的 概念 与 性 质 


E 指数 的 概念 


指数 的 编制 是 从 物价 的 变动 产生 的 。 作 为 一 种 对 比 性 的 统计 指标 
具有 相对 数 的 形式 ,通常 表现 为 百分数 。 它 表明 : 若 把 作为 对 比 基 准 的 
水 平 ( 基 数 ) 视 为 100, 则 所 要 考察 的 现象 水 平 相当 于 基数 的 多 少 。 比 如 ， 
已 知 某 年 全 国 的 零售 物价 指数 为 105%% ,这 就 表示 : 若 将 基期 年 份 (通常 
为 上 年 ) 的 一 般 价格 水 平 看 成 是 100%, 则 当年 全 国 的 价格 水 平 就 相当 于 
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基 年 的 105%, 或 者 说 ,当年 的 价格 上 涨 了 5%。 

从 对 比 性 质 来 看 ,指数 通常 是 不 同时 间 的 现象 水 平 的 对 比 , 它 表 明 现 象 在 时 间 上 的 变动 
情况 (动态 )。 此 外 ,指数 还 可 以 是 不 同 空间 (如 不 同 国家 、 地 区 、 部 门 ,企业 等 ) 的 现象 水 平 的 
对 比 ,或 者 ,是 现象 的 实际 水 平 与 计划 (规划 或 目标 ) 水 平 的 对 比 ,这 些 可 以 看 成 是 动态 对 比 
指数 方法 的 拓展 。 可 见 ,指数 在 经 济 分 析 上 上 有 具有 十 分 广阔 的 应 用 领域 。 

统计 指数 的 概念 有 广义 和 狭义 两 种 理解 。 广 义 指数 是 泛 指 社会 经 济 现象 数量 变动 的 比 
较 指标 , 即 用 来 表明 同类 现象 在 不 同 空间 、 不 同时 间 、 实 际 与 计划 对 比 变动 情况 的 相对 数 ; 狭 
义 指数 仅 指 反映 不 能 直接 相 加 的 复杂 社会 经 济 现 象 在 数量 上 综合 变动 情况 的 相对 数 。 例 
如 ,要 说 明 一 个 国家 或 一 个 地 区 商品 价格 综合 变动 情况 ,由 于 各 种 商品 的 经 济 用 途 、 规 格 、 型 
号 .计量 单位 等 不 同 ,不 能 直接 将 各 种 商品 的 价格 简单 对 比 , 而 要 解决 这 种 复杂 经 济 总 体 各 
要 素 相 加 问题 ,就 要 编制 统计 指数 综合 反映 它们 的 变动 情况 。 本 项 目 主要 基于 统计 指数 的 
狭义 的 概念 探讨 指数 的 作用 、 编 制 方法 及 其 在 统计 分 析 中 的 运用 。 


B 指数 的 性 质 


正确 应 用 指数 的 统计 方法 ,必须 要 对 指数 性 质 有 深刻 的 了 解 ,概括 地 讲 ,指数 具有 以 下 
性 质 : 

(1) 相对 性 。 指 数 是 总 体 各 变量 在 不 同 场合 下 对 比 形成 的 相对 数 , 它 可 以 度量 一 个 变 
量 在 不 同时 间或 不 同 空间 的 相对 变化 ,如 一 种 商品 的 价格 指数 或 数量 指数 ,这 种 指数 称 为 个 
体 指 数 ; 它 也 可 用 于 反映 一 组 变量 的 综合 变动 ,如 消费 价格 指数 反映 一 组 指定 商品 和 服务 的 
价格 变动 水 平 ,这 种 指数 称 为 综合 指数 。 总 体 变量 在 不 同时 间 上 对 比 形成 的 指数 称 为 时 间 
性 指数 ,在 不 同 空间 上 对 比 形成 的 指数 称 为 区 域 性 指数 。 

(2) 综合 性 。 指 数 是 反映 一 组 变量 在 不 同 场合 下 的 综合 变动 水 平 , 这 是 就 狭义 的 指数 
而 言 的 , 它 也 是 指数 理论 和 方法 的 核心 问题 。 实 际 中 所 计算 的 主要 是 这 种 指数 。 没 有 综合 
性 ,指数 就 不 可 能 发 展 成 为 一 种 独立 的 理论 和 方法 论 体 系 。 综合 性 说 明 指数 是 一 种 特殊 的 
相对 数 , 它 是 由 一 组 变量 或 项 目 综合 对 比 形成 的 。 比 如 ,由 若干 种 商品 和 服务 构成 的 一 组 消 
费 项 目 , 通 过 综合 后 计算 价格 指数 ,以 反映 消费 价格 的 综合 变动 水 平 。 

G) 平均 性 。 指 数 是 总 体 水 平 的 一 个 代表 性 数值 。 平 均 性 的 含义 有 二 ;一 是 指数 进行 
比较 的 综合 数量 是 作为 个 别 量 的 一 个 代表 ,这 本 身 就 具有 平均 的 性 质 ;二 是 两 个 综合 量 对 比 
形成 的 指数 反映 了 个 别 量 的 平均 变动 水 平 ,比如 物价 指数 反映 了 多 种 商品 和 服务 项 目 价格 
的 平均 变动 水 平 。 


> 9. 1.2 指数 作用 


(1) 综合 反映 社会 经 济 现象 总 变动 方向 及 变动 幅度 。 在 统计 实践 中 ,经 常 要 研究 多 种 
商品 或 产品 的 价格 综合 变动 情况 ,多 种 商品 的 销售 量 或 产品 产量 的 总 变动 ,多 种 产品 的 成 本 
总 变动 ,多 种 股票 价格 综合 变动 等 。 这 类 问题 由 于 各 种 商品 或 产品 的 使 用 价值 不 同 , 各 种 股 
票 价格 涨 跌幅 度 和 成 交 量 不 同 , 所 研究 总 体 中 的 各 个 个 体 不 能 直接 相 加 。 指 数 法 的 首要 任 
务 ,就 是 把 不 能 直接 相 加 总 的 现象 过 渡 到 可 以 加 总 对 比 , 从 而 反映 复杂 经 济 现象 的 总 变动 方 


向 及 变动 幅度 。 
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(2) 分 析 现 象 总 变动 中 各 因素 变动 的 影响 方向 及 影响 程度 。 利 用 指数 体系 理论 可 以 测 
定 复杂 社会 经 济 现象 总 变动 中 ,各 构成 因素 的 变动 对 现象 总 变动 的 影响 情况 ,并 对 经 济 现象 
变化 作 综 合 评价 。 任 何 一 个 复杂 现象 都 是 由 多 个 因子 构成 的 ,如 : 

销售 额 二 价格 头 销 售 量 

又 如 影响 利润 总 额 变 化 的 各 种 因素 有 产品 产量 .产品 销售 量 .产品 成 本 .产品 销售 
价格 等 。 运 用 指数 法 编制 商品 零售 价格 指数 和 零售 量 指数 ,可 分 析 它 们 的 变动 对 商品 
零售 总 额 变 动 的 影响 。 编 制 产 品 产量 指数 .产品 销售 量 指数 .产品 成 本 指数 和 产品 销售 
价格 指数 等 并 分 别 对 它们 进行 测定 ,根据 各 因素 变动 影响 ,可 综合 评价 利润 总 额 变动 的 
情况 。 

(3) 反映 同类 现象 变动 趋势 。 编 制 一 系列 反映 同类 现象 变动 情况 的 指数 形成 指数 数 
列 , 可 以 反映 被 研究 现象 的 变动 趋势 。 例 如 ,根据 1980 一 2002 年 共 23 年 的 零售 商品 价格 资 
料 ,编制 22 个 环比 价格 指数 ,从 而 构成 价格 指数 数列 。 这 样 ,就 可 以 揭示 价格 的 变动 趋势 ， 
研究 物价 变动 对 经 济 建设 和 人 民生 活水 平 的 影响 程度 。 

此 外 ,利用 统计 指数 还 可 以 进行 地 区 经 济 综合 评价 对比, 研究 计划 执行 情况 。 


> 9. 1.3 指数 的 分 类 
指数 的 种 类 很 多 ,可 以 按 不 同 的 标志 作 不 同 的 分 类 。 


[i 按 其 反映 对 象 范围 的 不 同 分 


(1) 个 体 指 数 。 说 明 个 别 事物 (例如 某 种 商品 或 产品 等 ) 数 量变 动 的 相对 数 叫 做 个 体 指 
数 。 个 体 指数 通常 记 作 天, 例如 : 


个 体 产品 产量 指数 K ,一 全 


个 体 产品 成 本 指数 KF 


个 体 物价 指数 K= 


上 式 中 ,Q 代表 产量 ,Z 代表 单位 产品 成 本 .P 代表 商品 或 产品 的 单价 ;下 标 1 代表 报告 
期 ,下 标 0 代表 基期 。 

可 见 ,个 体 指数 就 是 同一 种 现象 的 报告 期 指标 数值 与 基期 指标 数值 对 比 而 得 的 发 展 速 

指标 。 

(2) 总 指数 。 说 明度 量 单位 不 相同 的 多 种 事物 数量 综合 变动 的 相对 指数 叫 作 总 指数 。 
例如 工业 总 产量 指数 、 零 售 物价 总 指数 等 。 总 指数 与 个 体 指数 有 一 定 的 联系 ,可 以 用 个 体 指 
数 计算 相应 的 总 指数 。 用 个 体 指数 简单 平均 求 得 的 总 指数 , 称 为 简单 指数 ;用 个 体 指 数 加 权 
平均 求 得 的 总 指数 , 称 为 加 权 指 数 。 


| 2. 按 其 所 反映 的 社会 经 济 现 象 特征 不 同 分 


(1) 数量 指标 指数 。 简 称 数 量 指数 ,主要 是 指 反 映 现象 的 规模 、 水 平 变 化 的 指数 。 例 如 


一 一 0 
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商品 销售 量 指数 .工业 产品 产量 指数 等 。 
(2) 质量 指标 指数 。 简 称 质 量 指数 ,是 指 综 合 反映 生产 经 营 工作 质量 变动 情况 的 指数 。 
例如 物价 指数 、 产 品 成 本 指数 。 


由 3. 按 其 采用 基期 的 不 同 分 


(1) 定 基 指数 。 将 不 同时 期 的 某 种 指数 按时 间 先 后 顺序 排列 ,形成 指数 数列 。 在 同一 
个 指数 数列 中 ,如 果 各 个 指数 都 以 某 一 个 固定 时 期 作为 基期 ,就 称 为 定 基 指数 。 
(2) 环比 指数 。 如 果 各 个 指数 都 是 以 报告 期 的 前 一 期 作为 基期 , 则 称 之 为 环比 指数 。 


Ẹ 按 其 对 比 内 容 不 同 分 


CL) 动态 指数 。 由 两 个 不 同时 期 的 同类 经 济 变量 值 对 比 形成 的 指数 ,说 明 现 象 在 不 同 
时 间 上 发 展 变化 的 过 程 和 程度 。 

(2) 静态 指数 。 包 括 空间 指数 和 计划 完成 情况 指数 两 种 。 空 间 指数 (地 域 指数 ) 是 将 不 
同 空间 (如 不 同 国家 、 地 区 、 部 门 ` 企 业 等 ) 的 同类 现象 进行 比较 的 结果 ,反映 现象 在 不 同 空间 
的 差异 程度 。 计 划 完 成 程度 指数 是 由 同一 地 区 ,单位 的 实际 指标 值 与 计划 指标 数值 对 比 而 
形成 的 指数 ,反映 计划 的 执行 情况 或 完成 与 未 完成 的 程度 。 

指数 方法 论 主要 论述 动态 指数 ,动态 指数 是 出 现 最 早 \ 应 用 最 多 的 指数 ,也 是 理论 上 最 
为 重要 的 统计 指数 。 静 态 指 数 则 是 动态 指数 在 实际 应 用 中 的 扩展 。 


B 按 常用 的 计算 总 指数 的 方法 或 形式 分 


CL) 综合 指数 。 从 数量 上 表明 不 能 直接 相 加 的 社会 经 济 现象 的 总 指数 。 
(2) 平均 指数 。 以 个 体 指 数 为 基础 ,采取 平均 形式 编制 的 总 指数 。 


> 9. 1.4 指数 基本 问题 


编制 总 指数 可 以 考虑 两 种 方式 :一 是 先 综合 后 对 比 ,二 是 先 对 比 后 平均 。 


E 先 综合 后 对 比 的 方式 


如 果 我 们 知道 某 几 种 商品 价格 和 销售 量 资料 ,研究 全 部 商品 的 价格 和 销售 量变 动情 况 。 
首先 将 各 种 商品 的 价格 或 销售 量 资料 加 总 起 来 ,然后 通过 对 比 得 到 相应 的 总 指数 ,这 种 方法 
通常 称 为 综合 (总 和 ) 指 数 法 。 此 时 我 们 会 遇 到 这 样 两 个 问题 ,一 是 不 同 商品 的 数量 和 价格 
不 能 直接 加 总 ,或 者 说 ,直接 加 总 的 结果 没有 实际 经 济 含义 ;二 是 简单 综合 法 编制 的 指数 明 
显 地 受到 商品 计量 单位 的 影响 。 _ 简单 综合 指数 难以 成 为 现象 变动 程度 的 一 种 客观 测 
度 , 因 为 不 同 商品 的 价格 或 销售 量 都 是 “不 同 度量 ”的 现象 ,它们 构成 了 不 能 直接 加 总 的 “ 复 
杂 现 象 总 体 ” ,倘若 不 解决 有 关 现 象 的 同 度量 问题 就 将 其 直接 加 总 ， 显然 难以 得 到 适当 的 指 


数 计算 结果 。 
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[ 2. 先 对 比 后 平均 的 方式 


首先 将 各 种 商品 的 价格 或 销售 量 资料 进行 对 比 ( 计 算 个 体 指数 ) ,然后 通过 个 体 指数 的 
平均 得 到 相应 的 总 指数 ,这 种 方法 通常 称 为 “平均 指数 法 ”。 这 样 当 我 们 将 各 种 商品 的 个 体 
指数 作 简 单 平均 时 ,没有 适当 地 考虑 不 同 商品 的 重要 性 程度 。 从 经 济 分 析 的 角度 看 ,各 种 商 
品 的 重要 性 程度 是 有 差异 的 ,简单 平均 指数 不 能 反映 这 种 差异 ,因而 难以 满足 分 析 的 要 求 。 

归纳 起 来 ,简单 综合 指数 与 简单 平均 指数 都 存在 方法 上 的 缺陷 。 但 是 ,迄今 为 止 ,综合 
指数 法 与 平均 指数 法 仍然 是 编制 统计 指数 的 两 个 基本 方法 。 为 了 运用 综合 法 编制 总 指数 ， 
必须 首先 考虑 被 比较 的 诸 现 象 是 否 同 度量 、 怎 样 同 度量 的 问题 。 因 此 说 编制 综合 指数 的 基 
本 问题 是 “ 同 度量 的 问题 ,解决 这 一 问题 的 方法 就 是 编制 加 权 综 合 指数 。 而 为 了 运用 平均 
法 编制 总 指数 ,又 必须 首先 考虑 被 比较 诸 现象 的 重要 性 程度 是 否 相 同 、 怎 样 衡 量 的 问题 (此 
外 ,还 有 选择 何 种 平均 数 形式 的 问题 ) 。 因 此 说 ,编制 平均 指数 的 基本 问题 之 一 是 合理 加 权 
的 问题 ,解决 这 一 问题 的 方法 就 是 编制 加 权 平均 数 。 


[9. 2 加 权 指数 | 2” 加 权 指 数 


PP 9.2.1 加 权 综 合 指数 


加 权 综 合 指 数 (weighted aggregative index number) 是 通过 加 权 来 测定 一 组 项 目的 综合 
变动 状况 。 若 所 测定 的 是 一 组 项 目的 物 量 变动 状况 , 称 为 数量 指数 ,如 产品 产量 指数 、 商 品 
销售 量 指数 等 : 若 所 测定 的 是 一 组 项 目的 质量 变动 状况 , 则 称 为 质量 指数 ,如 价格 指数 .产品 
成 本 指数 等 。 但 由 于 权 数 可 以 固定 在 不 同时 期 ,因而 加 权 综 合 指数 有 不 同 的 计算 公式 。 


E 基期 变量 值 加 权 


基期 变量 值 加 权 是 指 在 计算 一 组 项 目的 综合 指数 时 ,把 作为 权 数 的 各 变量 值 固定 在 基 
期 来 计算 指数 。 早 在 1864 年 ,德国 学 者 拉 斯 贝尔 斯 (Laspeyres) 就 曾 提出 用 基期 消费 量 加 
权 来 计算 价格 指数 ,这 一 指数 被 称 为 拉 氏 指数 或 工 式 指数 。 拉 氏 加 权 法 可 推广 到 其 他 指数 
的 计算 。 基 期 变量 值 加 权 的 拉 氏 质量 指数 和 数量 指数 的 一 般 计算 公式 为 


HH 


pia 
= (9-1) 
ii J Poqo 
X Pon 
= (9-2) 
quo z Paths 


式 中 ,pyo 为 质量 指数 ;gyo 为 数量 指数 ;po 和 户 分 别 为 一 组 项 目 基 期 和 报告 期 的 质量 数 
值 ;go 和 gi 分 别 为 一 组 项 目 基期 和 报告 期 的 物 量 数值 。 

表 9-2 是 粮油 连锁 店 2013 年 和 2014 年 三 种 商品 的 零售 价格 和 销售 量 资料 。 试 分 别 以 
基期 销售 量 和 零售 价格 为 权 数 ,计算 三 种 商品 的 价格 综合 指数 和 销售 量 综合 指数 。 


—2 
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表 9-2 粮油 连锁 店 三 种 商品 的 价格 和 销售 量 


销售 量 单价 (元 ) 
商品 名 称 计量 单位 
2013 年 2014 年 2013 年 2014 年 
KK kg 1 200 1 500 1,2 ia 
面粉 kg 1 500 2 000 1.0 i 
色拉 油 kg 500 600 3.2 35 


假定 销售 量 为 gq, 零 售 价格 为 p, 计 算 过 程 见 表 9-3。 
表 9-3 加 权 综 合 指 数 计算 表 


销售 量 单价 (元 ) 销售 额 ( 元 ) 

商品 名 称 | 计量 单位 | 2013 年 | 2014 年 | 2013 年 | 2014 年 | 2013 年 | 2014 年 

Pon Pi Qo 
qo qı Po pr Po go An 

KK kg 1 200 1 500 1.2 1.3 1440 1 950 1 800 1 560 
面粉 kg 1 500 2 000 1.0 Ll 1 500 2 200 2 000 1 650 
色拉 油 kg 500 600 3.2 3.5 1 600 2 100 1 920 1 750 
合计 4 540 6 250 5 720 4 960 


根据 (9-1) 式 ,得 价格 综合 指数 为 


m Meneses a 0 
Pio Shogo #540 109. 25% 
根据 (9-2) 式 ,得 销售 量 综合 指数 为 
X boa _ 5720 本 
qin = S— = = 125. 99% 
. D pode 540 


4 

计算 结果 表明 ,与 2013 年 相 比 ,该 粮油 连锁 店 三 种 商品 的 零售 价格 平均 上 涨 了 9. 25%. 
销售 量 平均 上 涨 了 25.99%. 

拉 氏 指数 由 于 以 基期 变量 值 为 权 数 , 可 以 消除 权 数 变 动 对 指数 的 影响 ,从 而 使 不 同时 期 
的 指数 具有 可 比 性 。 但 拉 氏 指数 也 存在 一 定 的 缺陷 。 比 如 ,物价 指数 是 在 假定 销售 量 不 变 
的 情况 下 报告 期 价格 的 变动 水 平 ,这 一 指数 尽管 可 以 单纯 反映 价格 的 变动 水 平 , 但 不 能 反映 
出 消费 量 的 变化 。 从 实际 生活 角度 看 ,人 们 更 关心 在 报告 期 销售 量 条 件 下 价格 变动 对 实际 
生活 的 影响 。 因 此 , 拉 氏 价格 指数 在 实际 中 应 用 得 很 少 。 而 拉 氏 数量 指数 是 假定 价格 不 变 
的 条 件 下 报告 期 销售 量 的 综合 变动 , 它 不 仅 可 以 单纯 反映 出 销售 量 的 综合 变动 水 平 , 也 符合 
计算 销售 量 指数 的 实际 要 求 。 因 此 , 拉 氏 数量 指数 在 实际 中 应 用 得 较 多 。 


用 2. 报告 期 变量 值 加 权 


报告 期 变量 值 加 权 是 指 在 计算 一 组 项 目的 综合 指数 时 ,把 作为 权 数 的 变量 值 固定 在 报 
告 期 来 计算 指数 。1874 年 德国 学 者 帕 胞 (Paasche) 曾 提出 用 报告 期 物 量 加 权 来 计算 物价 指 
数 ,这 一 指数 被 称 为 帕 氏 指数 ,或 简称 为 已 式 指数 。 帕 氏 加 权 法 可 推广 到 其 他 指数 的 计算 。 


o-—— 
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报告 期 变量 值 加 权 的 帕 氏 质量 指数 和 数量 指数 的 一 般 计 算 公 式 为 


Maa 

Pio = (9-3) 
j X Pon 
Maa 

o 一 (9-4) 
os DS) bigs 


根据 表 9-1 中 的 数据 资料 ,分 别 以 报告 期 销售 量 和 零售 价格 为 权 数 计算 三 种 商品 的 价 
格 综合 指数 和 销售 量 综合 指数 。 


Bimi = 之 Pu _ 6 250 _ 109.27% 
SS poa 5 720 
_ UP _ 6250 _ 96 ory 


计算 结果 表明 ,与 1998 年 相 比 ,该 粮油 商店 三 种 商品 的 零售 价格 平均 上 涨 了 9.27%. 
销售 量 平 均 上 涨 了 26.01%. 

帕 氏 指数 因 以 报告 期 变量 值 为 权 数 ,不 能 消除 权 数 变动 对 指数 的 影响 ,因而 不 同时 期 的 
指数 缺乏 可 比 性 。 但 帕 氏 指数 可 以 同时 反映 出 价格 和 消费 结构 的 变化 ,具有 比较 明确 的 经 
济 意义 。 在 实际 应 用 中 , 常 采用 帕 氏 公式 计算 价格 .成 本 等 质量 指数 。 而 帕 氏 数量 指数 由 于 
包含 了 价格 的 变动 ,意味 着 按 调整 后 的 价格 来 测定 物 量 的 综合 变动 ,这 本 身 不 符合 计算 物 量 
指数 的 目的 ,因此 帕 氏 数量 指数 在 实际 中 应 用 得 较 少 。 

从 上 面 的 计算 和 分 析 中 可 以 看 到 ,采用 不 同时 期 的 权 数 计算 结果 是 有 一 定 差别 的 。 但 从 
实际 应 用 的 角度 看 ;计算 数量 指数 时 大 多 采用 式 (9-2) ,而 计算 质量 指数 时 大 多 采用 式 (9-3)。 

此 外 ,在 实际 应 用 中 ,有 时 权 数 既 不 是 固定 在 基期 ,也 不 是 固定 在 报告 期 ,而 是 固定 在 某 
个 具有 代表 性 的 特定 时 期 。 这 一 加 权 方 法 的 特点 是 , 权 数 不 受 基 期 和 报告 期 的 限制 ,使 指数 
的 编制 具有 较 大 的 灵活 性 。 特 别 是 在 编制 若干 个 时 期 的 多 个 指数 时 ,可 以 消除 因 权 数 不 同 
而 对 指数 产生 的 影响 ,从 而 使 指数 具有 可 比 性 。 

K 9-4 是 某 公司 生产 三 种 产品 的 有 关 数 据 。 试 以 2010 年 不 变价 格 为 权 数 ,计算 各 年 的 


产品 产量 指数 。 
表 9-4 某 企业 生产 三 种 产品 的 有 关 资 料 
产 量 2010 年 
商品 名 称 计量 单位 A 
oni i 2012 年 2013 年 2014 年 不 变价 格 ( 千 元 ) 
甲 PH 1 000 900 1 100 50 
Z Fe 120 125 140 3 500 
再 TH 200 220 240 300 


解 : 设 2010 年 不 变价 格 为 p1o ,各 年 产量 分 别 为 va vais sgu WE EP HERO 


D poms 50 X 900 + 3 500 X 125 + 300 X 220 
whe > poq 50 X 1 000+ 3 500 x 120 + 300 x 200 


—2 
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_548 500_ 和 
=530 000/02 49% 


Di Pogu _ 50 X 1 100-+3 500 X 140 + 300 X 240 
aus ST pg 50X 900 F3 500 X 125 + 300 X 220 


—617 000 


= = 0 
eae soo 49% 


Di bogu _ 617 000 
gia/12 FF 530 000 
上 述 产量 指数 消除 了 价格 变动 对 产量 的 影响 ,单纯 反映 出 各 年 产量 的 综合 变动 状况 。 
这 一 结果 实际 上 就 是 按 2010 年 不 变价 格 计算 的 工业 总 产值 发 展 速度 。 


Is. 综合 指数 法 的 特点 


从 以 上 关于 用 综合 指数 法 编制 总 指数 的 方法 和 原理 可 知 , 它 具 有 如 下 三 个 特点 : 

(1) 借助 于 同 度量 因素 进行 综合 对 比 。 在 分 析 复 杂 社 会 经 济 现象 综合 变动 时 ,不 同 度 
量 单位 的 事物 不 能 直接 相 加 ,但 有 时 又 需要 把 它们 作为 一 个 总 体 来 研究 ,必须 把 它们 加 总 起 
来 ,这 是 运用 综合 指数 法 首先 要 解决 的 问题 。 

众所周知 ,人 们 从 事 社 会 生产 活动 ,创造 了 各 种 各 样 的 产品 ,这 些 不 同 的 产品 具有 不 同 
的 使 用 价值 ,不 同 外 形 和 不 同 的 计量 单位 ,是 不 能 同 度量 的 事物 。 价 格 是 价值 的 货币 表现 。 
因此 在 编制 指数 时 ,就 可 用 不 同 的 产品 或 商品 流通 的 量 乘 以 它们 相应 的 价格 ,借助 价格 这 一 
媒介 ,使 不 能 同 度量 的 使 用 价值 转化 为 能 同 度量 的 价值 量 。 这 样 就 可 以 把 两 个 时 期 的 价值 
量 进行 综合 对 比 了 。 

(2) 同 度量 因素 的 时 期 要 固定 。 运 用 综合 指数 法 编制 总 指数 时 ,人 们 只 关心 一 个 因素 
的 变动 程度 。 如 工业 产品 产量 总 指数 只 反映 各 种 工业 产品 产量 的 总 变动 ;零售 价格 总 指数 
只 反映 多 种 商品 零售 价格 的 总 变动 。 这 就 要 求 编制 指数 时 ,把 新 加 入 的 媒介 因素 作为 同 度 
量 因 素 加 以 固定 ,来 测定 人 们 所 关心 的 因素 的 变动 。 

(3) 用 综合 指数 法 编制 总 指数 ,使 用 的 是 全 面 材料 ,没有 代表 性 误差 。 例 如 ,用 综合 指 
数 法 编制 产品 产量 指数 ,要 求 使 用 报告 期 和 基期 的 全 部 产品 产量 资料 , 即 利用 全 面 统计 资 
料 。 全 面 统计 资料 只 存在 着 登记 误差 ,而 不 存在 代表 性 误差 。 


> 9. 2.2 ”加权 平均 指数 


加 权 平均 指数 (weighted average index number) 是 以 某 一 时 期 的 总 量 为 权 数 对 个 体 指 
数 加 权 平 均 计算 出 来 的 。 其 中 作为 权 数 的 总 量 通常 是 两 个 变量 的 乘积 , 它 可 以 是 价值 总 量 ， 
如 商品 销售 额 (销售 价格 与 销售 量 的 乘积 ) .工业 总 产值 (出 厂价 格 与 生产 量 的 乘积 ) ,也 可 以 
是 其 他 总 量 ,如 农产品 总 产量 (单位 面积 产量 与 收获 面积 的 乘积 ) 等 。 而 其 中 的 个 体 指 数 可 
以 是 个 体质 量 指数 ,也 可 以 是 个 体 数 量 指数 。 加 权 平均 指数 因 权 数 所 属 时 期 的 不 同 , 有 以 下 
计算 形式 。 


116. 42 % 


e— 
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E 基期 总 量 加 权 


基期 总 量 加 权 指 数 是 以 基期 总 量 为 权 数 对 个 体 指数 加 权 平 均 计算 出 来 的 。 由 于 这 一 指 
数 在 计算 形式 上 采用 了 算术 平均 形式 , 故 也 被 称 为 加 权 算术 平均 指数 。 


设 基期 总 量 权 数 为 poqo ,个 体质 量 指数 为 双 , 个 体 数量 指数 为 全, 则 基期 总 量 加 权 的 质 
量 指数 和 数量 指数 的 一 般 公 式 为 


sy ipao 
Ayo = m (9-5) 
eS) bod 
2 pogo 
in = —S"*— (9-6) 
1e 2 pogo 
K 9-5 是 某 企 业 生 产 三 种 产品 的 有 关 资 料 。 试 计算 三 种 产品 的 单位 成 本 总 指数 和 产量 
表 9-5 “ 某 企业 生产 三 种 产品 的 有 关 数 据 
总 成 本 (万 元 ) 个 个 
商品 名 称 | 计量 单位 个 体 成 本 指数 个 体 产 量 指数 
FEW Cho qo) REM) Chi / Po) (qi /qo) 
甲 件 200 220 1. 14 1.03 
a 台 50 50 1.05 0. 98 
丙 箱 120 150 1. 20 1. 10 
根据 式 (9-5) 得 三 种 产品 的 单位 成 本 总 指数 : 
2 Zi paqo 
bio = - 
D Poa 
_1.14X200+1. 05 X50+1. 20X120 
200+50+120 
_ 524.5 
= g 0 73% 
根据 式 (9-6) 得 三 种 产品 的 产量 总 指数 为 
pS: © pogo 
qi = ae 
2 boa 
_ 1.03 X200+0. 98X50 1. 10120 
200+50+120 
_ 387 _ a 
= 379 7 104. 59% 


计算 结果 表明 ,报告 期 与 基期 相 比 ,该 企业 三 种 产品 的 单位 成 本 平均 提高 了 14. 73% = 
种 产品 的 产量 平均 提高 了 4. 59%。 


—o 
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E 报告 期 总 量 加 权 


报告 期 总 量 加 权 是 以 报告 期 总 量 为 权 数 对 个 体 指数 加 权 平均 计算 出 来 的 。 由 于 这 一 
数 在 计算 形式 上 采取 了 调和 平均 形式 , 故 也 被 称 为 加 权 调和 平均 指数 。 


设 报告 期 总 量 权 数 为 fg ,个 体质 量 指数 为 人 ,个 体 数量 指数 为 生 , 则 报告 期 总 量 加 权 
的 质量 指数 和 数量 指数 的 一 般 公式 为 


me 


Pip = na (9-7) 
区 Bayes -Ja mti 

ap = 一 pm (9-8) 
aa —— hig 


根据 表 9-4 有 关 数 据 ,用 报告 期 总 成 本 为 权 数 计算 三 种 产品 的 单位 成 本 总 指数 和 产量 
总 指数 。 
根据 式 (9-7) 得 三 种 产品 的 单位 成 本 总 指数 为 
i= i 
23 Pi 7 pq 
220 十 50 十 150 
~ 220 50 , 150 


1.14 ' 1.05 ' 1.20 


= = 9 
TAT 114. 88% 
根据 式 (9-8) 得 三 种 产品 的 产量 总 指数 为 
Nan 220 +50 +150 
om 1 220 50, 150 
Dag 1.03 + 0.98 1.10 
A as seat 
Joo. 98 14 14% 


计算 结果 表明 ,报告 期 与 基期 相 比 ,该 企业 三 种 产品 的 单位 成 本 平均 提高 了 14. 88%, 

ee een 4.74%, 
量 加 权 指 数 中 的 权 数 除 上 述 介绍 的 po go 和 pr qu 外 ,还 可 以 使 用 po qi 和 pr go 等 总 

形式 。 ， 但 比较 常用 的 是 基期 \ 量 和 报告 期 总 量 加 权 . 而 且 从 指数 的 实际 意义 和 效果 来 看 ， m 

总 量 加 权 多 用 于 计算 数量 指数 ,而 报告 期 总 量 加 权 则 多 用 于 计算 质量 指数 。 另 外 ,我 们 也 
容易 看 出 ， 采用 上 述 总 量 加 权 的 指数 公式 可 以 演化 成 综合 指数 。 因 此 , 当 采 用 po go 和 pi q 
加 权时 ,加权 平 均 指 数 实际 上 是 加 权 综 合 指数 的 一 种 变形 。 但 二 者 所 依 
据 的 计算 资料 是 不 同 的 。 加 权 综合 指数 的 计算 通常 需要 掌握 全 面 的 资 
料 ,实际 编制 中 往往 具有 一 定 的 困难 ,而 加 权 平 均 指 数 则 既 可 以 依据 全 
面 的 资料 来 编制 ,也 可 以 依据 非 全 面 资料 来 编制 ,也 更 符合 实际 数据 的 
要 求 , 因 此 加 权 平 均 指数 在 实际 中 是 更 为 广泛 。 此 外 ,加 权 平 均 指 数 中 
的 权 数 也 可 以 采取 比重 形式 ,其 权 数 (W) 可 以 在 一 定时 期 内 相对 固定 
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下 来 ,连续 使 用 几 年 ,这 就 是 所 谓 的 固定 权 数 加 权 的 平均 指数 。 例 如 ,我 国 的 商品 零售 价 
格 指数 就 是 采用 固定 权 数 加 权 的 算术 平均 形式 计算 的 ,其 权 数 每 年 根据 住户 调查 资料 作 
相应 的 调整 。 


9.3 ”指数 体系 和 因素 分 析 


9.3.1 指数 体系 


| 1. 指数 体系 的 概念 


社会 经 济 现象 之 间 的 相互 联系 .相互 影响 的 关系 是 客观 存在 的 。 有 些 社会 经 济 现象 之 
间 的 联系 可 以 用 经 济 方程 式 表现 出 来 ,如 : 
商品 销售 额 二 商品 销售 量 X 商 品 销售 价格 
生产 总 成 本 三 产品 产量 X 单 位 产品 成 本 
上 述 的 这 种 关系 , 按 指 数 形式 表现 时 ,同样 也 存在 这 种 对 等 关系 。 即 : 
商品 销售 额 指数 三 商品 销售 量 指数 XX 商品 销 售 价格 指数 
生产 总 成 本 指数 二 产品 产量 指数 XX 单位 产品 成 本 指数 
在 统计 分 析 中 ,将 一 系列 相互 联系 、 彼 此 间 在 数量 上 存在 推算 关系 的 统计 指数 所 构成 的 
整体 称 为 指数 体系 。 
上 述 指数 体系 , 按 编制 综合 指数 的 一 般 原理 ,以 符号 用 公式 可 写成 
Sar = dinPo x Xap 
Dupo 2 gpo ya Po 
从 上 面 所 举 的 例子 中 可 发 现 ,统计 指数 体系 一 般 具 有 两 个 特征 ， 
(1) 具备 三 个 或 三 个 以 上 的 指数 。 
(2) 体系 中 的 单个 指数 在 数量 上 能 相互 推算 。 如 已 知 销售 额 指数 、 销 售 量 指数 , 则 可 推 
算出 价格 指数 ;已 知 价格 指数 、 销 售 量 指数 , 则 可 推出 销售 额 指数 。 
(3) 现象 总 变动 差额 等 于 各 个 因素 变动 差额 的 和 。 


B 指数 体系 的 作用 


指数 体系 主要 有 以 下 三 方面 的 作用 : 

一 是 指数 体系 是 进行 因素 分 析 的 根据 。 即 利用 指数 体系 可 以 分 析 复 杂 经 济 现象 总 变动 
中 各 因素 变动 影响 方向 和 程度 。 

二 是 利用 各 指数 之 间 的 联系 进行 指数 间 的 相互 推算 。 例 如 ,我 国 商品 销售 量 总 指数 往 
往 就 是 根据 商品 销售 额 总 指数 和 价格 总 指数 进行 推算 的 。 即 : 

商品 的 销售 量 指数 一 销售 额 指数 二 价格 指数 

三 是 用 综合 指数 法 编制 总 指数 时 ,指数 体系 也 是 确定 同 度量 因素 时 期 的 根据 之 一 。 因 

为 指数 体系 是 进行 因素 分 析 的 根据 ,要 求 各 个 指数 之 间 在 数量 上 要 保持 一 定 的 联系 。 因 此 ， 


一 一 名 
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编制 产品 产量 指数 时 ,如 用 基期 价格 作 同 度量 因素 ,那么 编制 产品 价格 指数 时 就 必须 用 报告 
期 的 产品 产量 作为 同 度量 因素 ;如 果 编 制 产品 产量 指数 用 报告 期 价格 作 同 度量 因素 ,那么 编 
制 产 品 价格 指数 时 就 必须 用 基期 的 产品 产量 作为 同 度量 因素 。 


9. 3.2 复杂 总 体 的 因素 分 析 


对 于 社会 经 济 现象 复杂 总 体 的 变动 , 当 确定 其 是 由 两 个 或 两 个 以 上 因素 乘积 的 函数 时 ， 
可 以 开展 因素 分 析 。 对 两 个 因素 进行 分 析 称 两 因素 分 析 , 对 两 个 以 上 因素 进行 分 析 称 多 因 
素 分 析 。 


[i 复杂 总 体 两 因素 分 析 


对 于 复杂 总 体 , 由 于 存在 不 可 同 度量 问题 :因而 在 进行 复杂 总 体 的 因素 分 析 时 ,必须 严 
格 遵循 综合 指数 计算 的 一 般 原 则 和 方法 。 
复杂 总 体 总 量 指标 的 变动 ( 即 总 指数 ) ,可 用 如 下 公式 表达 ， 
Var 
Dabo 
总 指数 可 分 解 为 数量 指标 综合 指数 和 质量 指标 综合 指数 两 因素 的 乘积 。 指 数 体系 
WF: 


Nar o Daip x Dhia 
Dido Po >) a bo 2 pon 


绝对 额 关 系 如 下 : 
Sap Dabo (Sabo Dao po) + (Pin Xpo) 
某 企 业 生产 几 种 使 用 价值 和 计量 单位 都 不 同 的 产品 ,报告 期 和 基期 总 产值 及 有 关 数 据 
见 表 9-6. 


表 9-6 某 工业 企业 基期 报告 期 产值 情况 表 


产品 产量 出 厂价 格 (元 ) 期 总 告 期 总 设 总 

产品 名称 | HM | an e. e p 
甲 乙 go qı Po bi qoPo gp npo 
A 吨 6 000 5 000 110 100 66 50 55 
B 台 10 000 12 000 50 60 50 72 60 
ç 件 40 000 | 41 000 20 20 80 82 82 
合计 - - 196 204 197 


从 表 9-6 数据 可 以 看 出 ,该 企业 总 产值 的 动态 指数 为 


ah _ 204 
Sapo 196 
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报告 期 总 产值 比 基 期 增加 : 
Sapir — Jupo = 204—196 = 8( 万 元 ) 
这 个 结果 是 由 于 产品 产量 和 价格 两 个 因素 变动 共同 引起 的 。 
其 中 :产品 产量 变动 影响 为 
Dabo 197 = 
i. 6 = 
产品 产量 增加 使 总 产值 增加 的 绝对 额 为 
ar po — Dgopo = 197—196 = 1( 万 元 ) 
产品 出 厂价 格 变动 影响 为 
Man 204 = 
Tae = To7 De 55% 
出 厂价 格 提 高 使 总 产值 增加 的 绝对 额 为 
S pia — >) pom = 204—197 = 7( 万 元 ) 
用 相对 数 表示 :104.08%==100. 51% X 103. 55% 
用 绝对 额 表 示 :8 万 元 =1 万 元 十 7 万 元 


综 上 所 述 , 该 工业 企业 报告 期 的 工业 总 产值 比 基 期 增长 了 4.08%, 增 加 额 为 8 万 元 ,是 
由 于 产品 产量 和 出 厂价 格 两 因素 发 生变 动 共同 引起 的 ,其 中 产品 产量 增长 0. 51% ,使 总 产值 


增加 1 万 元 ,出 厂价 格 增 长 3.55% ,使 总 产值 增加 7 万 元 。 


[2 复杂 总 体 的 多 因素 分 析 


上 述 某 工 业 企业 三 种 产品 总 产值 的 变动 , 既 受 产量 变动 影响 ,又 受 出 厂价 格 影响 。 假 如 
我 们 把 产量 因素 再 分 解 为 职工 平均 人 数 和 全 员 劳 动 生产 率 ,把 该 企业 总 产值 的 变动 ,分 解 为 


:个 因素 进行 分 析 。 
开展 复杂 总 体 多 因素 分 析 时 ,要 按 如 下 两 个 原则 进行 : 


首先 ,把 影响 复杂 总 体 变动 的 各 个 因素 ,按照 数量 指标 在 前 ,质量 指标 在 后 的 顺序 进行 排列 。 
其 次 , 当 分 析 某 一 因素 对 复杂 总 体 变 动 的 影响 时 ,未 被 分 析 的 后 面 诸 因素 要 固定 在 基期 


水 平 ,而 已 被 分 析 过 的 前 面 诸 因素 , 则 要 固定 在 报告 期 水 平 。 


以 表 9-7 资料 为 例 , 说 明 复 杂 总 体 的 多 因素 分 析 方法 。 
表 9-7 菜单 位 基期 报告 期 产量 及 价格 情况 表 
ees. | 
出 厂 (元 ) 
产品 名 称 | 计量 单位 | ”职工 平均 人 数 (人 ) 全 员 劳 动 生产 率 — 
基期 报告 其 基期 报告 其 基期 报告 期 
四 A To Ti Ls L Po Pi 
A 吨 1 200 1 000 5 5 110 100 
B 台 1 000 1 000 10 12 50 60 
C tt 800 1 000 50 41 20 20 
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从 表 9-7 可 以 看 出 ,该 企业 总 产值 受到 职工 平均 人 数 (T) 、 全 员 劳 动 生产 率 (L) 和 出 厂价 
格 (P) 三 个 因素 共同 影响 。 指 数 体系 如 下 : 
Dee, Dy Teh, Daa Debi P 
Seles STR DFP į JTL Ps 
绝对 额 关 系 如 下 : 
又) 而 二 ,两 :一 >) DLP 
= (DT LoPo — D} Tole Po)+ (2 TiLiPo — Dj TiLoPo) 
HERL — 2 TB) 
根据 表 9-6 整理 计算 的 总 产值 资料 见 表 9-8。 


表 9-8 某 企业 基期 、 报 告 期 产值 计算 表 


sate 工业 总 产值 (万 元 ) 
基期 报告 期 | 按 报告 期 平均 人 数 计算 的 基期 总 产值 | 按 基期 价格 计算 的 报告 期 总 产值 
Teds: Pe | Ty Te Pi Ty Lesh HAB 
A 66 50 55 55 
50 72 50 60 
c 80 82 100 82 
合计 196 204 205 197 


该 企业 工业 总 产值 的 动态 指数 为 


DMLPi 204 n 
到 TD =m 104. 08% 
报告 期 工业 总 产值 比 基 期 增加 额 为 
DTihP— DTLoP, = 204 — 196 = 8( 万 元 ) 
其 中 ,职工 平均 人 数 变 动 影响 为 


STP _ 205 _ 104 59% 


TioP, 196 


影响 绝对 额 为 
DT Lo Po — >) Tole Po = 205 一 196 一 9( 万 元 ) 
全 员 劳 动 生产 率 变动 影响 为 
TiLiP _ 197 _ 
STLP, 205 96. 10% 


影响 绝对 额 为 
YTL Po — YT Lo Po = 197 — 205 =— 8( 万 元 ) 
出 三 价格 变动 影响 为 
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Tar 
ZTP: _ 204 _ 103,55% 
SREP 197 


影响 绝对 额 为 
DML. Pi — DTL Po = 204 — 197 = 707 70) 

用 相对 数 表示 :104. 08% =104. 59% X96. 10% X103. 55% 

用 绝对 额 表示 :8 万 元 ==9 万 元 一 8 万 元 十 7 万 元 

综 上 所 述 , 该 企业 工业 总 产值 由 基期 196 万 元 增加 到 报告 期 的 204 万 元 ,增加 了 8 万 
元 ,增长 率 为 4.08% ,这 一 结果 是 由 于 职工 平均 人 数 、 全 员 劳 动 生产 率 和 产品 出 厂价 格 三 个 
因素 共同 引起 的 。 其 中 ,平均 人 数 增长 4. 59% ,使 总 产值 增加 9 万 元 ;全 员 劳 动 生产 率 下 降 
3.9% ,使 总 产值 减少 8 万 元 ;出 厂价 格 增长 3. 55% ,使 总 产值 增加 7 万 元 。 

:个 因素 分 析 弥 补 了 两 因素 分 析 的 不 足 ,前面 我 们 对 该 企业 总 产值 变动 情况 作 产 量 和 价 

格 两 因素 分 析 时 ,看 到 企业 增加 的 8 万 元 总 产值 中 ,有 1 万 元 是 由 于 产量 增长 所 致 ,另外 7 万 元 
是 价格 增长 引起 的 ,给 人 的 印象 是 两 个 因素 都 是 增长 的 ,这 就 把 产量 上 升 的 真相 掩盖 了 ,容易 
给 决策 者 假象 ,放松 对 生产 的 管理 和 经 济 核算 ,通过 多 因素 分 析 , 再 把 产量 进一步 分 解 为 职工 
平均 人 数 和 全 员 劳 动 生产 率 , 就 可 看 到 ,全 厂 职 工 平 均 人 数 报告 期 比 基 期 是 增加 的 ,但 劳动 生 
产 率 却 有 所 下 降 ,产量 影响 的 1 万 元 产值 是 由 职工 平均 人 数 增加 使 总 产值 增加 9 万 元 和 劳动 
生产 率 下 降 使 总 产值 减少 8 万 元 所 致 。 问 题 揭示 清楚 ,使 于 企业 加 强 管理 ,提高 经 济 效 益 。 


> 9. 3.3 平均 指标 指数 的 因素 分 析 


E 平均 指标 指数 的 含义 


从 综合 指数 的 定义 上 可 以 看 出 , 当 一 个 总 量 指标 可 以 分 解 成 两 个 因素 的 乘积 时 ,就 可 以 
计算 每 一 个 因素 的 变动 对 总 量 的 影响 ,这 就 是 综合 指数 的 含义 。 同 样 地 ,对 于 平均 指标 来 
讲 , 我 们 也 可 以 用 上 述 方法 进行 分 析 , 因 为 平均 指标 也 能 够 分 解 成 两 个 影响 因素 。 

例如 , 当 研 究 某 企业 职工 工资 水 平 的 变动 时 ,可 以 计算 平均 工资 : 


z- rf 
pHi 
式 中 ,z 为 每 组 的 工资 额 ;/ 为 各 组 的 职工 人 数 。 
上 式 还 可 以 写成 如 下 形式 ， 
一 一 P £ 
z=), SI 


ste, 为 各 组 职工 的 比重 , 即 频率 。 
Dy, 
上 式 说 明 ,平均 工资 实际 上 受 两 个 因素 的 影响 , 一个 是 各 组 职工 的 工资 水 平 , 另 一 个 是 每 
组 职工 所 占 的 比重 ,因此 ,类 似 于 综合 指数 的 定义 ,我 们 按照 如 下 方式 定义 有 关 平 均 指标 指数 : 


平均 指标 指数 一 本 (9-9) 


—o 
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式 中 ,1 为 报告 期 ;0 为 基期 。 
这 个 指数 通常 称 为 可 变 构成 指数 (简称 可 变 指数 )， ee 


Za eh 
固定 结构 指数 = - (9-10) 


Day S 
S/S LT HE DEA T P-L RS 


结构 变动 指数 <-> (9-11) 


这 个 指数 也 称 为 结构 影响 指数 , 它 反映 了 总 体内 各 组 结构 的 变动 对 总 平均 数 的 影响 。 


B 因素 分 析 方 法 


由 上 述 方法 定义 的 有 关 平均 指标 指数 ,构成 如 下 的 指数 体系 : 


从 相对 量 角度 ， 
pore fi DIE fı 
Xi Dh x Di 
Xo fi h: fo 
a SIR 
HE 
H 708 FE OC = [EL AE 28 PAT RO K TS A 
从 绝对 量 角度 : 
a | Dan elt (= a -Z| 
By; 


SP ESE as KI SG A = h ak A A Sy 5 aad FS AE ER AS IA J BL -+ h Hg AS ZE oy 
引起 的 平均 指标 的 增加 额 

上 述 公式 是 对 平均 指标 的 变动 进行 因素 分 析 的 基础 。 

下 面 通过 一 个 例子 来 说 明 平均 指标 的 因素 分 析 方 法 。 

表 9-9 是 某 企业 基期 和 报告 期 职工 的 月 工资 数据 。 


表 9-9 某 企 业 职 工 月 工资 情况 


月 工资 额 ( 元 ) 职工 人 数 ( 人 ) 工资 总 额 (元 ) 
工人 类 别 
基期 (xo) | 报告 期 (zx) | 基期 ( 疡 ) | 报告 期 (f1)| Cao fo) (afi) (ao fi) 
工种 A 700 780 48 40 33 600 31 200 28 000 
工种 B 750 810 50 60 37 500 48 600 45 000 
工种 C 800 830 80 80 64 000 66 400 64 000 
& it 一 E 178 180 135 100 146 200 137 000 
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首先 ,计算 平均 工资 指数 ,说 明 平 均 工 资 的 变动 情况 : 
报告 期 的 平均 工资 去 = 》)zxfi/ X) fı = 146 200/180 = 812. 2( 元 ) 
基期 的 平均 工资 = Dd) a0 fo/ >) fo = 135 100/178 = 759. 0( 元 ) 


54% — 71 — 812.2 
可 变 指 数 =, 759.0 


%,—Z)=812. 2 一 759. 0 一 53. 2036) 
其 次 ,计算 固定 结构 指数 ,说 明 工 资 水 平 的 变动 情况 : 
2m 广 /2 广 146200/180 _ 812.2 


=107.0% 


固定 结构 指数 Ff/ ifr 137 000/180 761.1 ~ 106 7% 
Dafi Brf 812. 2— 761.1 = 51. 1 
DA DW 
再 计算 结构 变动 指数 : 
7 X xofı/ fi _ 137 000/180 _ A 
结构 变动 指数 一 Zt Dah = 735 100/178 一 100 3% 
ee 而 十。 = 761. 1—759.0 = 2.1050) 
S H 
上 述 指数 之 间 的 关系 如 下 : 
相对 量 角度 ， 


107.0% =106. 7% X 100.3% 
绝对 量 角 度 : 
53. 2=51. 1 十 2. 1 
上 述 计 算 结 果 表 明 :从 相对 量 角度 来 看 ,报告 期 职工 平均 工资 比 基 期 上 升 了 7.0% ,是 由 
于 工资 水 平 提高 了 6.7% 和 结构 变动 使 平均 工资 上 升 0. 3% 两 个 因素 共同 作用 的 结果 ;从 绝 
对 量 角 度 来 看 ,每 组 平均 工资 提高 使 总 的 平均 工资 上 升 了 51. 1 元 ,每 组 结构 变动 使 总 的 平 
均 工资 上 升 了 2. 1 元 ,两 个 因素 共同 作用 ,导致 总 的 平均 工资 共 增 加 53. 2 元 。 


9.4 几 种 常用 的 经 济 指数 


指数 作为 一 种 重要 的 经 济 分 析 指 标 和 方法 ,在 实践 中 获得 了 广泛 应 用 。 但 在 不 同 场合 
往往 需要 运用 不 同 的 指数 形式 。 一 般 而 言 , 先 择 指数 形式 的 主要 标准 应 该 是 指数 的 经 济 分 
析 意 义 , 除 此 而 外 .有 时 还 要 考虑 实际 编制 工作 的 可 行 性 ,以 及 对 指数 分 析 性 质 的 某 些 特殊 
要 求 。 现 以 国内 外 常见 的 主要 经 济 指数 为 例 , 对 指数 方法 的 具体 应 用 加 以 介绍 。 


| 1. 消费 者 价格 指数 和 零售 物价 指数 


消费 者 价格 指数 (又 称 生活 费用 指数 ) 是 综合 反映 各 种 消费 品 和 生活 服务 价格 的 变动 程 
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度 的 重要 经 济 指数 ,通常 简 记 为 CPI。 该 指数 可 以 用 于 分 析 市 场 物价 的 基本 动态 ,调整 货币 
工资 以 得 到 实际 工资 水 平 ,等 等 。 它 是 政府 制定 物价 政策 和 工资 政策 的 重要 依据 ,世界 各 国 
都 在 编制 这 种 指数 。 

我 国 的 消费 者 价格 指数 (居民 消费 价格 指数 ) 是 采用 固定 加 权 算术 平均 指数 方法 来 编制 
的 。 其 主要 编制 过 程 和 特点 是 :首先 ,将 各 种 居民 消费 划分 为 八大 类 ,包括 食品 \. 衣 着 、 家 庭 
设备 及 用 品 、 医 疗 保健 交通 和 通信 工具 、 文 教 娱乐 用 品 . 居 住 项 目 及 服务 项 目 等 ,下 面 再 划 
分 为 若干 个 中 类 和 小 类 ;其 次 ,从 以 上 各 类 中 选 定 325 种 有 代表 性 的 商品 项 目 ( 含 服务 项 目 ) 
入 编 指 数 ,利用 有 关 对 比 时 期 的 价格 资料 分 别 计算 个 体 价格 指数 ;再 次 ,依据 有 关 时 期 内 各 
种 商品 的 销售 额 构成 确定 代表 品 的 比重 权 数 , 它 不 仅 包括 代表 品 本 身 的 权 数 (直接 权 数 ) ,而 
且 还 要 包括 该 代表 品 所 属 的 那 一 类 商品 中 其 他 项 目 所 具有 的 权 数 (附加 权 数 ) ,以 此 提高 入 
编 项 目 对 于 所 有 消费 品 的 一 般 代表 性 程度 ;最 后 , 按 从 低 到 高 的 顺序 ,采用 固定 加 权 算 术 平 
均 公式 ,依次 编制 各 小 类 、 中 类 的 消费 价格 指数 和 消费 价格 总 指数 : 

Dit w Dit w 

村 Sw 100 

K 9-10 给 出 了 居民 消费 价格 指数 计算 表 。 已 知 各 大 类 、 交 通 工 具 和 通信 工具 中 类 及 其 
代表 商品 (代表 规格 品 ) 的 有 关 资 料 ( 有 关 数 据 均 为 假设 ) 。 要 求 据 以 编制 有 关 的 价格 指数 ， 
并 填充 表 中 空缺 的 数据 。 

利用 表 中 资料 和 公式 ,依次 计算 各 类 别 的 消费 价格 指数 和 消费 价格 总 指数 如 下 : 

(1) 计算 交通 工具 和 通信 工具 两 个 中 类 的 价格 指数 。 


I (9-12) 


交通 工具 类 指数 为 ， 
L, 2i: Ww A Soio oita 111 104. 37% 
通信 工具 类 指数 为 : 
= 2i w _ q. 104-+ 18. 686 _ 89. 77% 
表 9-10 某 市 居民 消费 价格 指数 计算 表 
类 别 及 品名 规格 等 级 | 计量 单位 see 指数 (%) 权 数 TREX ARE 
基期 计算 期 
总 指数 102. 69 100 
一 、 食 品类 104. 15 42 43. 743 
二 衣着 类 95. 46 15 14. 319 
三 、 家 庭 设备 及 用 品 102. 70 11 11. 297 
四 、 医 疗 保健 = = 一 一 110. 43 和 3. 313 
五 .交通 和 通信 工具 = = 98. 53 4 3.941 
1. 交通 工具 = = = = 104. 37 (60) 62. 622 
摩托 车 100 型 辆 8 450 8 580 101. 54 《45》 45. 693 
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续 表 
类 别 及 品名 规格 等 级 | 计量 单位 指数 (%) | 权 数 | 指数 X 权 数 
基期 计算 期 
自行 车 660m 辆 336 360 107. 14 (50) 53. 570 
三 轮 车 普遍 辆 540 552 102. 22 (5) Sy 
2. 通信 工具 89.77 (40) 35. 908 
电话 机 中 档 部 198 176 88. 88 (80) 71. 104 
BP 机 中 档 部 900 840 93. 33 (20) 18. 666 
六 .文教 娱乐 用 品 = eg e = 101. 26 5 5. 063 
七 ` 居 住 项 目 103. 50 14 14, 490 
八 .服务 项 目 108. 74 6 6. 524 


由 此 可 以 进一步 计算 各 中 类 的 "指数 关 权 数 ? 资 料 , 这 些 结果 均 以 斜体 数字 填充 于 表 9-8 
中 (下 同 ) 。 
(2) 计算 交通 和 通信 工具 大 类 的 价格 指数 。 


_ Dips w _ 62.662 +35. 908 


= E; o, 

Tes on aT 98.53 % 

(3) 计算 居民 消费 价格 总 指数 。 
7 ya a 
I, = 100 
_ 43 743 十 14. 319+11. 297+3. 313 十 3. 941+5. 063+14. 490+6. 524 
100 
=102. 69% 


F 


我 国 的 零售 物价 指数 编制 程序 与 消费 者 价格 指数 基本 相同 ,也 是 采用 固定 加 权 算 术 平 
均 指 数 公式 。 目 前 ,零售 物价 指数 的 入 编 商 品 共计 353 项 ,其 中 不 包括 服务 项 目 ( 但 以 往 包 
含 一 部 分 对 农村 居民 销售 的 农业 生产 资料 , 现 已 取消 ), 对 商品 的 分 类 方式 也 与 消费 者 价格 
指数 有 所 不 同 。 这 些 都 决定 了 两 种 价格 指数 在 分 析 意 义 上 的 差别 。 消 费 者 价格 指数 综合 
映 城乡 居民 所 购买 的 各 种 消费 品 和 生活 服务 的 价格 变动 程度 ,零售 物价 指数 则 反映 城乡 市 
场 各 种 零售 商品 (不 含 服务 ) 的 价格 变动 程度 。 


B 工业 生产 指数 


工业 生产 指数 概括 反映 一 个 国家 或 地 区 各 种 工业 产品 产量 的 综合 变动 程度 , 它 是 衡量 
经 济 增长 水 平 的 重要 指标 之 一 。 世 界 各 国都 非常 重视 工业 生产 指数 的 编制 ,但 采用 的 编制 
方法 却 不 完全 相同 。 

在 我 国 , 工 业 生产 指数 是 通过 计算 各 种 工业 产品 的 不 变价 格 产 值 来 加 以 编制 的 。 其 基 
本 编制 过 程 是 :首先 ,对 各 种 工业 产品 分 别 制定 相应 的 不 变价 格 标准 ( 记 为 p.) ;其 次 , 逐 项 计 
算 各 种 产品 的 不 变价 格 产值 ,加 总 起 来 就 得 到 全 部 工业 产品 的 不 变价 格 总 产值 ;最 后 ,将 不 
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同时 期 的 不 变价 格 总 产值 加 以 对 比 ,就 得 到 相应 时 期 的 工业 生产 指数 。 
记 t 时 期 的 不 变价 格 总 产值 为 >) qe (t==0,1,2,3,…), 则 该 时 期 的 工业 生产 指数 就 
是 固定 加 权 综 合 指数 的 形式 : 


Diab ei Dab. 
Dab. Dab 
采用 不 变价 格 法 编制 工业 生产 指数 的 特点 是 ,只 要 具备 了 完整 的 不 变价 格 产值 资料 ， 

就 能 够 很 容易 地 计算 出 有 关 的 生产 指数 ;而 且 可 以 在 不 同 层 次 上 (如 各 地 区 各 部 门 、 各 企 

业 等 ) 进 行 编制 ,满足 各 方面 的 分 析 需 要 。 然 而 ,不 变价 格 的 制定 和 不 变价 格 产值 的 计算 

本 身 却 是 一 项 非常 浩 繁 的 工作 ,这 项 工作 又 必须 连续 不 断 地 .全面 地 展开 ,其 难度 可 想 而 

知 。 尤 其 是 在 市 场 经 济 条 件 下 ,要 在 整个 工业 生产 领域 内 运用 不 变价 格 计算 完 整 的 产值 

资料 ,面临 着 很 多 实际 的 问题 。 因 此 ,我 国 工 业 生产 指数 编制 方法 的 改革 势 在 必 行 。 

与 我 国 的 情况 不 同 , 在 国外 ,较为 普遍 地 采用 平均 指 形式 来 编制 工业 生产 指数 。 计 算 公 

式 为 


Vi (9-13) 


= Dia * Poqo 
2 Pode 
其 中 ,i, 为 各 种 工业 品 的 个 体 产量 指数 ,pogq。 则 为 相应 产品 的 基期 增加 值 。 编 制 这 种 工 
业 生 产 指 目的 是 为 了 说 明 工 业 增 加 值 中 物 量 因素 的 综合 变动 程度 ,其 分 析 意义 与 一 般 的 工 
业 总 产量 指数 是 有 所 不 同 的 。 
在 实践 中 ,为 了 简化 指数 的 编制 工作 ,常常 以 各 种 工业 品 的 增加 值 比 重 作为 权 数 ,并 且 
将 这 种 比重 权 数 相对 固定 起 来 ,连续 地 编制 各 个 时 期 的 工业 生产 指数 ; 
Si, ew 
= The 


i (9-14) 


a (9-15) 


这 里 运用 了 “固定 加 权 算 术 平 均 指数 ”。 


Ẹ 股票 价格 指数 


股票 作为 一 种 特殊 的 金融 商品 ,也 有 价格 。 广 义 的 股票 价格 包括 票面 价格 、 发 行 价格 、 
账面 价格 、 清 算 价格 、 内 在 价格 ,市 场 价格 等 。 狭 义 的 股票 价格 , 即 通 常 所 说 的 市 场 价格 ,也 
称 股票 行 市 。 它 完全 随 股市 供求 行情 变化 而 涨 落 。 股 票 价格 指数 是 根据 精心 选择 的 那些 具 
有 代表 性 和 敏感 性 强 的 样本 股票 某 时 点 平均 市 场 价格 计算 的 动态 相对 数 ,用 于 反映 某 一 股 
市 股票 价格 总 的 变动 趋势 。 股 价 指 数 的 单位 习惯 上 用 “点 "表示 , 即 以 基期 为 100( 或 1 000), 
每 上 升 或 下 降 1 个 单位 称 为 1 点 。 股 价 指数 计算 的 方法 很 多 ,但 一 般 以 发 行 量 为 权 数 进行 
加 权 综 合 。 其 公式 为 
I= 2 pugs! >) Poids (9-16) 
式 中 ;pi; 和 poi 分 别 为 报告 期 和 基期 样本 股 的 平均 价格 ; 
qi 为 第 i 种 股票 的 报告 期 发 行 量 ( 也 有 采用 基期 的 )。 
股价 指数 是 反映 证 券 市 场 行情 变化 的 重要 指标 ,不 仅 是 广大 证 券 投 资 者 进行 投资 决策 
分 析 的 依据 ,而 且 也 被 视 为 一 个 地 区 或 国家 宏观 经 济 态势 的 “晴雨 表 ”。 世 界 各 地 的 股票 市 


o——. 
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场 都 有 自己 的 股票 价格 指数 。 在 一 个 国家 里 ,同一 股市 往往 有 不 同 的 股票 价格 。 下 面 介 绍 
几 种 常见 的 股票 价格 指数 。 

(1) 道琼斯 股价 平均 数 。 道 琼斯 股价 平均 数 (Dow-Jones's Average lndex) 由 美国 的 道 
琼斯 公司 计算 并 发 布 。 自 1884 年 第 一 次 开始 发 布 , 迄 今 已 有 一 个 多 世纪 。 它 是 久负盛名 、 
影响 最 广泛 的 一 种 股票 价格 指数 。 

道琼斯 股价 平均 数 以 在 纽约 交易 所 挂牌 上 市 交易 的 一 些 著 名 大 公司 的 股票 为 编制 对 
象 。 最 初 采用 简单 算术 平均 方法 计算 ,将 采样 股票 价格 总 额 除 以 公司 数 ,反映 的 是 每 一 公司 
的 平均 股票 价格 总 额 。 为 了 反映 每 一 单位 平均 股票 价格 ,应 将 采样 股票 价格 总 和 除 以 总 股 
数 ,但 由 于 考虑 到 增资 和 折 股 等 各 种 非 市 场 因 素 对 股票 总 股 数 的 影响 ,因此 后 来 采用 除数 修 
正法 ,即将 各 种 采样 股票 价格 总 和 除 以 一 个 修正 后 的 除数 来 计算 道琼斯 股价 平均 数 。 除 数 
修正 公式 为 ， 

修正 后 的 _ 非 市 场 因 素 影响 后 的 各 种 采样 股票 理论 价格 之 和 、 原先 除数 
新 除数 非 市 场 因 素 影 响 前 各 种 采样 股票 收盘 价 之 和 i 


二 采样 股票 价格 总 和 
道琼斯 股价 平均 数 一 - 修 应 后 的 新 际 到 


人 们 通常 引用 的 道琼斯 股价 指数 实际 是 一 族 平均 数 ,包括 : 

O 道琼斯 工业 股价 平均 数 。 它 由 美国 30 家 著名 工商 业 公司 股票 组 成 采样 股 。 主 
要 用 以 反映 整个 工商 业 股 票 的 价格 水 平 。 在 许多 场合 ,也 被 用 作 道 琼斯 股价 平均 数 的 
代表 。 

O 交通 运输 业 股 价 平均 数 。 以 美国 20 家 著名 的 交通 运输 公司 的 股票 为 采样 ,其 中 有 8 
家 铁路 公司 ,8 家 航空 公司 和 4 家 公路 货运 公司 。 

@ 公用 事业 股价 平均 数 。 以 美国 15 家 最 大 公用 事业 公司 的 股票 为 采样 股 ,反映 公用 
事业 类 股票 的 价格 水 平 。 

@ 股价 综合 平均 数 。 以 上 述 三 种 股价 平均 数 所 涉及 的 共 65 家 公司 的 股票 为 采样 股 综 
合 得 到 的 股价 平均 数 ,反映 整个 股票 市 场 价格 的 变化 趋势 。 

(2) 香港 恒生 指数 。1969 年 11 月 24 日 ,香港 恒生 银行 编制 并 首次 公开 发 表 香港 恒生 
指数 (Heng Seng lndex,HSI) 。 它 是 香港 证 券 市 场 上 最 有 代表 性 的 股票 价格 指数 。 

香港 恒生 指数 共 选 择 了 33 种 具有 代表 性 的 股票 (成 分 股 ) 为 指数 计算 对 象 。 其 中 ,金融 
业 4 种 ,公用 事业 6 种 ,地 产业 9 种 ,其 他 行业 14 种 。 

香港 恒生 指数 是 以 1964 年 7 月 31 日 为 基期 , 基 日 指数 定 为 100。 计 算 公 式 为 


_ 现时 成 分 股 的 总 市 值 
即时 指数 一 下 百 收市 时 成 分 股 的 总 市 值 多 上 日 收市 指数 


成 分 股 的 市 值 是 按 股价 乘 以 发 行 股 数 计 算 的 。 因 此 ,香港 恒生 指数 也 是 以 股票 发 行 量 
为 权 数 的 加 权 综合 指数 。 

(3) 上 海 证 券 交易 所 股价 指数 。 上 海 证 券 交 易 所 股价 指数 主要 有 上 证 综合 指数 和 上 证 
30 指数 。 
O 上 证 综合 指数 。 以 1990 年 12 月 19 日 为 基 日 (该 日 为 上 证 所 正式 营业 之 日 ) , 基 日 定 
为 100, 以 所 有 在 上 海 证 券 交易 所 上 市 的 股票 为 编制 范围 ,采用 以 股票 发 行 量 为 权 数 的 综合 
股价 指数 。 计 算 公 式 为 : 


一 一 多 
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式 中 :市价 总 值 是 股票 市 价 乘 发 行 股 数 ; 
基 日 市 价 总 值 也 称 为 除数 。 
当 市 价 总 值 出 现 非 交 易 因 素 ( 增 股 、 配 股 、 汇 率 等 ) 变 动 时 , 原 除数 需 修正 ,以 维持 指数 的 
连续 可 比 。 修 正 公 式 为 
正 后 的 市 价 总 值 


修 
修正 后 的 除数 一 修正 前 的 市 价 总 值 义 原 除数 


© 上 证 30 指数 。 以 在 上 海 证 券 交 易 所 上 市 的 A 股 中 选取 最 具 市 场 代表 性 的 30 种 样 
本 股票 为 计算 对 象 ,并 以 这 30 家 流通 股 数 为 权 数 的 加 权 综 合股 价 指数 , 取 1996 年 1 月 至 3 
月 的 平均 流通 市 值 为 指数 的 基期 ,指数 以 “点 ”为 单位 ,基期 指数 定 为 1 000 点 。 

(4) 深圳 证 券 交 易 所 股价 指数 

深圳 证 券 交 易 所 股价 指数 有 深 证 综合 指数 和 深 证 成 分 股指 数 。 

O 深 证 综合 指数 。 以 在 深圳 证 券 交 易 所 上 市 的 所 有 股票 为 对 象 编制 的 指数 ,1991 年 4 
月 3 日 为 指数 的 基 日 ,1991 年 4 月 4 日 公布 。 深 证 综合 指数 是 以 发 行 量 为 权 数 ,纳入 指数 计 
算 范围 的 股票 称 为 指数 股 。 指 数 计算 基本 公式 为 


指数 一 现时 指数 股 总 市 值 
BOA 基 日 指数 股 总 市 值 


若 遇 股市 结构 有 所 变动 ,其 修正 是 用 “连锁 ”方法 计算 得 到 的 指数 溯源 于 原 有 基期 ,以 维 
持 指数 的 连续 性 。 每 日 连锁 方法 的 计算 公式 为 


Oaea 今日 即时 指数 股 总 市 值 
今日 即时 指数 一 球 调 整 的 上 日 指数 股 收市 总 市 全 


© 深 证 成 分 股指 数 。 以 1994 年 7 月 20 日 为 基 日 , 基 日 指数 定 为 1 000, 于 1995 年 1 月 
23 日 开始 发 布 。 深 证 成 分 股指 数 采用 流通 量 为 权 数 ,计算 公式 同 深 证 综合 指数 。 深 证 成 分 
股指 数 是 从 上 市 公司 中 挑选 出 40 家 具有 代表 性 的 成 分 股 计算 ,成 分 股 选择 的 一 般 原则 是 : 
a 有 一 定 上 市 交易 日 期 ;b. 有 一 定 上 市 规模 ;c. 交易 活路 。 此 外 ,结合 考虑 公司 股份 的 市 盘 
率 ,公司 的 行业 代表 性 ,地 区 、 板 块 代表 性 ,公司 的 财务 状况 .管理 素质 等 。 


ja 产品 成 本 指数 


产品 成 本 指数 概括 反映 生产 各 种 产品 的 单位 成 本 水 平 的 综合 变动 程度 , 它 是 企业 或 部 
门 内 部 进行 成 本 管理 的 一 个 有 用 工具 。 记 各 种 产品 的 产量 为 g, 单 位 成 本 为 p, 则 全 部 可 比 
产品 ( 即 基期 实际 生产 过 且 计 算 期 仍 在 生产 的 产品 ) 的 综合 成 本 指数 通常 采用 帕 氏 公式 来 
编制 : 


X100% 


= Van 
DI pon 
该 指数 的 分 子 与 分 母 之 差 可 以 表示 ,由 于 单位 成 本 水 平 的 降低 (或 提高 ) ,使 得 计算 期 所 
生产 的 那些 产品 的 成 本 总 额 节约 (或 超支 ) 了 多 少 。 
类 似 地 ,在 对 成 本 水 平实 施 计 划 管 理 的 场合 .还 可 以 编制 相应 的 成 本 计划 完成 情况 指 
数 ,用 于 检查 有 关 成 本 计划 的 执行 情况 。 其 编制 方法 可 以 采用 派 氏 公式 : 
aa 
Spa 


P, (9-17) 


P, (9-18) 
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其 中 ,p, 为 计划 规定 的 单位 成 本 水 平 。 该 指数 的 分 子 与 分 母 之 差 ,可 以 说 明 计 划 执 行 
过 程 中 所 节约 或 超支 的 成 本 总 额 。 
不 过 ,在 同时 制订 了 产量 计划 的 条 件 下 , 则 应 该 采用 拉 氏 公式 编制 成 本 计划 完成 情况 
指数 : 
= SS Pign 
2 paan 


(9-19) 


Ës 


其 中 ,w 为 计划 规定 的 产量 水 平 。 

该 指数 可 以 在 兼顾 产量 计划 的 前 提 下 来 检查 成 本 计划 执行 情况 , 即 避 免 由 于 片面 追求 
完成 成 本 计划 而 破坏 了 产量 计划 。 但 在 企业 按照 市 场 需求 组 织 生 产 , 没 有 制订 产量 计划 ,或 
不 要 求 恪 守 产 量 计划 指标 的 情况 下 ,上 面 的 拉 氏 指数 就 失效 了 。 


a» tz 


在 商业 经 济 活动 中 ,指数 是 价格 及 数量 变动 的 重要 测度 。 价 格 之 间 的 变化 是 指 报告 期 
与 基期 之 比 再 乘 以 100, 这 个 相对 的 变化 值 描述 了 报告 期 与 基期 价格 之 间 的 变化 。 通 常 , 编 
制 的 综合 物价 指数 中 的 商品 使 用 了 加 权 的 方法 进行 了 测度 。 

消费 者 价格 指数 .工业 发 展 指数 和 股票 指数 是 应 用 广泛 的 经 济 指数 。 这 些 指 数 会 随 着 
时 间 的 推移 而 变动 和 调整 。 
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>> > | 实践 中 的 统计 
陶 氏 化 学 公司 的 质量 管理 


1940 年 , 陶 氏 化 学 公司 建造 了 第 一 个 镁 生产 设施 。 如 今 ,该 公司 已 成 为 全 球 最 大 的 石 
油 化 工 复合 型 企业 之 一 。 陶 氏 化 学 公司 的 产品 包括 镁 、 菜 乙烯 、 塑 料 、 胶粘剂 、 溶剂 \ 乙 二 酵 
等 ,这 些 产品 很 多 成 为 医药 .牙膏 水管、 家 具 、 塑 料 制 品 等 产品 的 基础 性 原料 。 陶 氏 化 学 年 
销售 额 高 达 490 亿美 元 ,拥有 200 多 个 生产 制造 基地 、3 200 多 种 产品 。 

陶 氏 化 学 公司 生产 的 镁 产量 占 全 球 总 产量 的 30 听 以 上 。 镁 是 一 种 极 轻 的 金属 。 它 用 于 
生产 网 球拍 ,旅行 箱 到 合金 轮胎 等 各 类 产品 。 该 公司 的 技术 部 门 为 了 确保 产品 生产 质量 , 利 
用 统计 质量 控制 方法 培训 其 技术 人 员 和 管理 人 员 。 

干燥 剂 的 生产 是 统计 质量 控制 的 一 个 成 功 应 用 。 在 这 个 应 用 中 ,技术 人 员 每 隔 一 定 周期 抽 
取 产 品 组 成 样本 ,计算 每 个 样本 的 平均 值 ,并 且 将 它们 记录 在 工控 制图 上 。 利 用 这 种 控制 图 , 陶 氏 
化 学 公司 的 质量 管理 专家 可 以 监控 产品 的 生产 过 程 ,并 随时 预警 过 程 的 非 正 常 运 转 。 一 个 实例 
是 ,管理 人 员 开 始 观 察 样本 均值 的 数值 ,该 数值 显示 有 一 次 过 程 的 运转 在 它 的 设计 范围 之 外 。 经 
过 对 控制 图 和 运转 情况 的 进一步 观察 ,管理 人 员 发 现 差异 可 以 追溯 到 某 个 操作 人 员 。 在 该 操作 人 
员 重 新 培训 后 ,通过 记录 的 工控 制图 ,可 以 看 到 过 程 的 质量 已 经 有 了 重大 改进 。 

陶 氏 化 学 公司 在 任何 使 用 统计 质量 控制 的 地 方 都 可 以 取得 质量 的 大 幅度 改进 。 公 司 每 
年 节约 成 本 数 十 万 美元 ,并 且 不 断 地 发 现 新 的 应 用 。 

本 项 目 我 们 将 介绍 陶 氏 化 学 公司 所 使 用 的 工控 制图 是 如 何 构造 的 。 控 制图 是 统计 质量 
控制 的 一 部 分 , 它 被 称 为 统计 过 程控 制 。 

国家 质量 管理 协会 对 质量 是 这 样 定义 的 :质量 是 产品 和 服务 的 所 有 性 质 和 特征 ,这 些 
性 质 和 特征 使 得 该 产品 和 服务 能 够 满足 特定 的 需要 。” 换 句 话说 ,质量 可 以 测量 产品 或 服务 
满足 顾客 需要 的 程度 。 很 多 企业 意识 到 在 全 球 化 竞争 的 今天 ,它们 必须 追求 高 水 平 的 质量 。 
因此 ,对 质量 的 检验 和 维护 有 必要 在 方法 上 加 以 重视 。 

今天 ,作为 高 绩效 组 织 基础 的 顾客 驱动 视角 改变 了 质量 问题 所 包含 
的 范围 ,从 简单 地 排除 生产 线 上 的 缺陷 产品 到 建立 广泛 的 公司 战略 。 扩 
大 质量 的 范围 自然 导致 全 面 质量 (Total Quality,TQ) 的 概念 。 

全 面 质量 是 以 人 为 本 的 管理 系统 ,其 目的 在 于 不 断 降低 实际 成 本 以 
持续 提升 顾客 满意 度 。 全 面 质量 管理 是 一 种 全 面 系统 的 方法 和 高 水 平 
战略 的 组 成 部 分 , 它 横 跨 职 能 与 部 门 运转 ,从 上 到 下 ,包括 全 体 员 工 , 通 
过 前 向 后 延伸 将 质量 管理 扩展 到 供应 链 与 消费 领域 。 全 面 质量 强调 学 习 和 适应 并 将 持续 改 
变 作 为 组 织 成 功 的 关键 。 不管 全 面 质量 在 不 同 组 织 中 是 如 何 实现 的 , 它 主 要 依据 三 个 基本 
原理 :以 顾客 为 中 心 ;将 参与 精神 与 团队 合作 贯穿 整个 组 织 ; 以 不 断 改 进 和 学 习 为 中 心 。 


[10. 1 质量 管理 的 内 涵 | 1 质量 管理 的 内 酒 


质量 管理 是 指 在 质量 方面 指挥 和 控制 组 织 的 协调 的 活动 。 在 质量 方面 的 指挥 和 控制 活 
动 , 通 常 包括 制定 质量 方针 和 质量 目标 及 质量 策划 、 质 量 控制 质量 保证 和 质量 改进 。 
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有 1. 质量 方针 和 质量 目标 


质量 方针 是 指 由 组 织 的 最 高 管理 者 正式 发 布 的 该 组 织 总 的 质量 宗旨 和 质量 方向 。 质 量 
方针 是 企业 经 营 总 方针 的 组 成 部 分 ,是 企业 管理 者 对 质量 的 指导 思想 和 承诺 。 企 业 最 高 管 
理 者 应 确定 质量 方针 并 形成 文件 。 质 量 方针 的 基本 要 求 应 包括 供 方 的 组 织 目标 和 顾客 的 期 
望 和 需求 ,也 是 供 方 质量 行为 的 准则 。 

质量 目标 是 组 织 在 质量 方面 所 追求 的 目的 ,是 组 织 质量 方针 的 具体 体现 ,目标 既 要 先 
进 ,又 要 可 行 ,便于 实施 和 检查 。 


[2 质量 策划 


质量 策划 是 质量 管理 的 一 部 分 ,致力 于 制定 质量 目标 并 规定 必要 的 运行 过 程 和 相关 资 
源 以 实现 质量 目标 。 质 量 策划 的 幕后 关键 是 制定 质量 目标 并 设法 使 其 实现 。 质 量 目标 在 质 
量 方面 所 追求 的 目的 ,其 通常 依据 组 织 的 质量 方针 制定 。 并 且 通 常 对 组 织 的 相关 职能 和 层 
次 分 别 规定 质量 目标 。 


js. 质量 控制 


质量 控制 是 质量 管理 的 一 部 分 ,致力 于 满足 质量 要 求 。 作 为 质量 管理 的 一 部 分 ,质量 控 
制 适用 于 对 组 织 任何 质量 的 控制 ,不 仅仅 限于 生产 领域 ,还 适用 于 产品 的 设计 、 生 产 原料 的 
采购 、 服 务 的 提供 市场 营销 、 人 力 资源 的 配置 .涉及 组 织 内 几乎 所 有 活动 。 

质量 控制 的 目的 是 保证 质量 ,满足 要 求 。 为 此 ,要 解决 要 求 ( 标 
准 ) 是 什么 、 如 何 实现 (过 程 )、 需 要 对 哪些 过 程 进 行 控制 等 问题 。 质 
量 控 制 是 一 个 设 定 标准 (根据 质量 要 求 ) 、 测 量 结果 ,判定 是 否 达 到 了 
预期 要 求 , 对 质量 问题 采取 措施 进行 补救 并 防止 再 发 生 的 过 程 ,质量 
控制 不 是 检验 。 总 之 ,质量 控制 是 一 个 确保 生产 出 来 的 产品 满足 要 
求 的 过 程 。 


ja. 质量 保证 


质量 保证 是 质量 管理 的 一 部 分 ,致力 于 提供 质量 要 求 会 得 到 满足 的 信任 。 质 量 保证 定 
义 的 关键 词 是 “信任 ”, 对 达到 预期 质量 要 求 的 能 力 提供 足够 的 信任 。 这 种 信任 是 在 订货 前 
建立 起 来 的 ,如 果 顾 客 对 供 方 没有 这 种 信任 则 不 会 与 之 订货 。 质 量 保证 不 是 买 到 不 合格 产 
品 以 后 保修 、 保 换 、 保 退 。 保 证 质量 满足 要 求 是 质量 保证 的 基础 和 前 提 , 质 量 管理 体系 的 建 
立 和 运行 是 提供 信任 的 重要 手段 。 因 为 质量 管理 体系 将 所 有 影响 质量 的 因素 ,包括 技术 、 管 
理 和 人 员 方 面 的 ,都 采取 了 有 效 的 方法 进行 控制 ,因而 具有 减少 、 消 除 ,特别 是 预防 不 合格 的 
机 制 。 组 织 规定 的 质量 要 求 , 包 括 产 品 的 、 过 程 的 和 体系 的 要 求 , 必 须 完 全 反映 顾客 的 需求 ， 
才能 给 顾客 以 足够 的 信任 。 因 此 :质量 保证 要 求 , 即 顾客 对 供 方 的 质量 体系 要 求 往往 需要 证 
实 , 以 使 顾客 具有 足够 的 信任 。 
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Bs. 质量 改进 


质量 改进 是 质量 管理 的 一 部 分 ,致力 于 增强 满足 质量 要 求 的 能 力 。 作 为 质量 管理 的 一 
部 分 ,质量 改进 的 目的 在 于 增强 组 织 满足 质量 要 求 的 能 力 , 由 于 要 求 可 以 是 任何 方面 的 , 因 
此 ,质量 改进 的 对 象 也 可 能 会 涉及 组 织 的 质量 管理 体系 、 过 程 和 产品 ,可 能 会 涉及 组 织 的 方 
方面 面 。 同 时 ,由 于 各 方面 的 要 求 不 同 , 为 确保 有 效 性 效率 或 可 追溯 性 ,组 织 应 注意 识别 需 
要 改进 的 项 目 和 关键 质量 要 求 , 考 虑 改进 所 需 的 过 程 ,以 增强 组 织 体系 或 过 程 实现 产品 并 使 
其 满足 要 求 的 能 力 。 


10.2 全 面 质量 管理 |] 


> 10.2.1 全 面 质量 管理 


全 面 质量 管理 是 指 企 业 全 体 员 工 及 管理 层 同心 协力 ,综合 运用 管理 技术 、 专 业 技 术 和 科 
学 方法 ,经济 地 开发 .研制 .生产 和 销售 用 户 满意 的 产品 的 管理 活动 。 


|i. 全 面 质 量 管理 的 特点 


(1) 管理 的 对 象 是 全 面 的 。 不 仅 要 管 好 产品 质量 ,而 且 要 管 好 产品 赖 以 形成 的 工作 质 
量 。 它 要 求 保证 质量 、 功 能 ,及 时 交 货 ,服务 周到 ,一 切 使 用 户 满意 。 

(2) 质量 管理 的 范围 是 全 面 的 。 即 实行 过 程 的 质量 管理 ,要 求 把 形成 产品 质量 的 设计 
试制 过 程 、 制 造 过 程 、 辅 助 生产 过 程 、 使 用 过 程 都 管 起 来 ,以 便 全 面 提高 产品 质量 。 

(3) 参加 质量 管理 的 人 员 是 全 面 的 。 它 要 求 企业 各 业务 部 门 、 各 环 
节 的 全 体 职工 都 参加 质量 管理 。 

(4) 管理 质量 的 方法 是 全 面 的 。 在 质量 分 析 和 质量 控制 时 必须 以 数 
据 为 科学 依据 ,以 统计 质量 控制 方法 为 基础 ,全 面 综 合 运用 各 种 质量 管 
理 方法 ;实行 组 织 管理 ,专业 技术 和 数理 统计 结合 ,充分 发 挥 在 质量 管理 
中 的 作用 。 


有 2. 全 面 质量 管理 的 要 求 


CL) 一 切 为 用 户 服务 。 在 全 面 质量 管理 中 ,必须 树立 以 用 户 为 中 心 、 为 用 户 服务 的 思 
想 。 为 用 户 服务 就 是 要 使 产品 的 质量 和 服务 质量 尽量 满足 用 户 的 要 求 ,产品 质量 的 好 坏 ,最 
终 应 以 用 户 的 满意 程度 为 标准 。 需 要 指出 的 是 .这 里 所 说 的 用户” 有 其 特定 的 含义 , 它 不 只 
是 指 产品 的 直接 用 户 ,而且 包括 企业 内 部 前 后 工序 、 前 后 工段 或 车 间 , 以 及 任何 一 件 工作 的 
执行 者 与 工作 结果 的 受用 者 之 间 的 关系 。 下 道 工序 是 上 道 工 序 的 用 户 , 下 一 个 车 间 是 上 一 
个 车 间 的 用 户 。 

(2) 以 预防 为 主 。 在 全 面 质量 管理 中 ,要 做 到 以 预防 为 主 , 即 通 过 分 析 影 响 产品 质量 的 
各 种 因素 , 找 出 主要 因素 ,加 以 重点 控制 ,防止 质量 问题 的 发 生 , 防 患 于 未 然 ,以 确保 生产 出 
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满足 用 户 需 要 的 产品 。 

(3) 一 切 以 数据 为 依据 。 全 面 质量 管理 强调 一 切 以 数据 为 依据 ,对 质量 问题 要 有 定量 
分 析 , 做 到 心中 有 数 ,掌握 质量 变化 规律 ,通过 调查 分 析 , 得 到 可 靠 的 结论 ,以 便 采取 解决 质 
量 问题 的 有 效 措施 。 

(4) 按 PDCA 管理 循环 办 事 。 全 面 质量 管理 要 求 采 用 一 套 科 学 的 程序 来 处 理 问题 , 即 
HE PDCA 管理 循环 来 开展 工作 ,并 通过 不 断 循环 来 达到 不 断 提高 质量 管理 水 平和 产品 质量 
的 目的 。 

PDCA 的 概念 最 早 是 由 美国 质量 管理 专家 戴 明 提出 来 的 ,所 以 又 称 为 “ 戴 明 环 ”。PDCA 
即 计划 (Plan) ,执行 (Do) .检查 (Check) 和 处 理 (Action), 它 是 一 个 标准 的 管理 工作 程序 ,也 
是 进行 质量 管理 的 四 个 步 又。 基本 模型 如 图 10-1 所 示 。 

目标 P( 计 划 ) : 即 根据 用 户 的 要 求 ,制定 相应 的 技术 
经 济 指标 、 质 量 目标 ,以 及 实现 这 些 目标 的 具体 措施 
和 方法 。 

D( 执 行 ) :按照 所 制订 的 计划 和 措施 付 诸 实施 。 

CORE) :对照 计划 ,检查 执行 的 情况 和 效果 ， 
及 时 发 现 问题 。 

A( 处 理 ) :对 检查 反馈 的 问题 进行 改进 。 

全 面 质量 管理 活动 的 运转 , 离 不 开 管 理 循环 的 
转动 ,这 就 是 说 ,改进 与 解决 质量 问题 ,都 要 运用 
= PDCA 循环 的 科学 程序 。 不 论 提 高 产品 质量 ,还 是 

图 10-1 PDCA 循环 基本 模型 减少 不 合格 品 ,都 要 先 提 出 目标 , 即 质量 提高 到 什么 

程度 ,不 合格 品 率 降 低 多 少 ? 就 

要 有 个 计划 ,这 个 计划 不 仅 包括 目标 ,而 且 也 包括 实现 这 个 目标 需要 采 

取 的 措施 ;计划 制订 之 后 ,就 要 按照 计划 进行 检查 ,看 是 否 实现 了 预期 效 

果 , 有 没有 达到 预期 的 目标 ;通过 检查 找 出 问题 和 原因 ;最 后 就 要 进行 处 
理 , 将 经 验 和 教训 制定 成 标准 、 形 成 制度 。 


eA & 
飞利浦 优化 团队 工作 质量 


在 飞利浦 中 国 总 部 的 办 公 室 走廊 里 ,随处 可 见 写 着 BEST 的 招贴 画 。 这 个 BEST HS 
义 可 不 是 简单 的 字面 意思 “最 好 ”, 而 是 Business Excellence through Speed and Teamwork 
(通过 速度 和 团队 合作 达到 卓越 经 营 ) 。 

其 中 ,PDCA 循环 帮助 飞利浦 实现 BEST 目标 的 一 种 重要 质量 管理 方法 。 

(1) Plan: 计 划 。 

质量 管理 的 第 一 步 , 是 对 目标 做 出 详细 的 计划 。 制 定 任何 目标 ,都 应 该 符合 SMART 原 
则 。 所 谓 的 SMART 原则 ,其 实 并 不 深奥 , 那 就 是 :详细 的 (Specific)、 可 测量 的 (Measura- 
ble) ,挑战 性 的 (Ambitious) ,现实 可 行 的 (Realistic) ,以 及 具备 实现 目标 的 时 间 表 (Timeta- 
ble). 
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飞利浦 有 一 个 非常 著名 的 “一 页 纸 战略 ”, 旨 在 帮助 团队 领导 者 在 计划 目标 时 ,尽量 符合 
SMART 原则 。 在 这 短 短 的 一 页 纸 中 ,要 确定 :短期 的 任务 目标 和 相对 长 期 的 战略 方向 ;为 
了 达成 目标 需要 的 各 种 资源 ;按照 平衡 记分 卡 “ 财 务 、 客 户 、 流 程 . 竞 争 ” 的 四 个 维度 分 别 要 达 
到 的 结果 ;以 及 目前 最 紧急 的 任务 等 。 例 如 ,公司 在 完善 公司 的 培训 项 目 ,可 以 从 培训 安排 、 
反馈 .评估 等 好 几 个 方面 去 入 手 。 那 么 就 要 先 分 析 目 前 在 什么 水 准 , 未 来 的 机 会 有 哪些 , 然 
后 把 培训 效率 要 提高 的 具体 百分比 、 需 要 各 个 事业 部 提供 的 资源 配合 .眼下 马上 可 以 改进 的 
工作 等 一 一 列 出 。 只 有 让 一 页 纸 战略 中 的 目标 尽量 具有 可 操作 性 ,才能 令 人 信服 地 展开 下 
一 步行 动 。 

(2) Do: 执 行 。 

为 了 更 好 地 完成 计划 ,达到 目标 ,飞利浦 向 员工 传递 了 这 样 一 种 观念 :一 定 要 对 自己 、 本 
团队 成 员 ,以 及 其 他 相关 团队 成 员 的 职责 、 能 力 以 及 合作 方式 都 有 了 非常 清楚 的 认 知 之 后 ， 
再 开始 执行 。 因 为 在 这 种 模式 下 ,才能 够 避免 员工 随意 的 个 人 行为 或 者 职责 不 清 、 互 相 推 证 
的 情况 。 

各 种 任务 好 比 一 个 金字 塔 。 最 底 端的 60% ,只 要 员工 能 够 正确 了 解 自 己 的 任务 范围 和 
素质 能 力 , 然 后 按照 常规 去 执行 ,就 可 以 完成 。 如 果 在 一 个 学 习 型 团队 中 ,每 个 人 都 能 做 好 
自己 的 这 60%% ,那么 整个 团队 就 已 经 获得 了 很 好 的 支撑 。 接 下 来 的 30%, 是 团队 内 无 法 解 
决 的 ,需要 承担 不 同 功能 的 团队 共同 完成 。 在 飞利浦 ,通常 的 做 法 是 跨 部 门 成 立 一 个 质量 提 
升 小 组 (Quality Improvement Team，QIT)。 比 如 ,要 降低 某 项 产品 的 客户 投诉 率 , 就 要 组 
织 产品 事业 部 市场 部 \ 客 服部 等 一 起 来 解决 。 最 后 的 10%, 是 最 复杂 的 一 些 问 题 ,以 项 目 管 
理 的 方式 来 解决 。 跨 国 、 跨 部 门 的 各 种 资源 调度 和 重 整 ,由 公司 高 层 来 推动 ,通常 需要 一 到 
两 年 的 时 间 才 能 够 完成 。 

(3) Check: 检 查 。 

在 行动 之 后 ,你 需要 对 行动 的 效果 做 一 个 整体 的 检查 。 飞 利 浦 在 全 公司 范围 内 比较 重 
要 的 检查 方法 ,除了 每 个 月 的 平衡 记分 卡 评估 ,每 年 度 的 客户 满意 度 调查 、 员 工 满意 度 和 交 
sk EH ISO 9000 的 管理 认证 之 外 ,还 有 飞利浦 公司 独创 的 卓越 经 营 (GBE) 检 查 项 目 :从 
领导 力 、 公 司 政策 战略 、 员 工 、 合 作 伙 伴 、 资 源 、. 总 部 评价 六 个 模型 来 评判 公司 的 全 面 质 量 管 
理 效果 。 而 从 另 一 个 角度 看 ,检查 其 实 是 始终 存在 于 各 个 环节 之 中 的 。 比 如 ,根据 收集 到 的 
培训 需求 信息 ,显示 领导 力 课程 的 需求 量 很 高 ,但 实际 上 开设 了 这 门 课 之 后 ,出 席 率 并 不 理 
想 。 那 么 马上 就 要 检查 原因 :是 时 间 安 排 不 合理 ? 还 是 课程 质量 不 高 ? 找到 原因 之 后 ,再 马 
上 回 到 计划 和 行动 环节 去 做 改善 。 

(4) Action: 474. 

检查 之 后 ,如 果 发 现 了 缺陷 和 弱点 ,那么 就 要 想 想 如 何 改进 ;或 者 说 ,完全 达到 了 事先 设 
定 的 目标 ,那么 也 还 是 可 以 从 中 学 到 很 多 东西 。 这 就 是 行动 环节 ,其 实 也 是 学 习 的 环节 。 一 
个 质量 管理 项 目的 完成 ,整个 团队 的 收获 不 仅 是 实现 了 某 个 目标 ,而 是 在 这 个 过 程 中 ,团队 
成 员 的 能 力 都 获得 了 提升 。 管 理 团 队 的 共同 成 长 ,是 PDCA 循环 中 非常 重要 的 一 个 效果 E 
是 因为 如 此 ,飞利浦 才能 够 进入 一 种 螺旋 式 上 升 的 状态 。 


> 10. 2.2 质量 管理 体系 


在 管理 领域 ,体系 和 系统 并 无 严格 区 别 . 既 可 称 为 体系 ,也 可 称 为 系统 。2000 版 
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ISO 9000 族 标准 将 两 者 视 为 同义词 ,所 以 ,质量 管理 体系 ,也 就 是 质量 管理 系统 ;系统 科学 的 
有 关 理 论 , 同 样 可 用 来 研究 质量 管理 体系 。 

ISO 9000 族 标 准将 体系 (系统 ) ,管理 体系 和 质量 管理 体系 三 个 术语 定义 为 : 

(1) 体系 (系统 )。 相 互 关联 或 相互 作用 的 一 组 要 素 。 

(2) 管理 体系 。 建 立方 针 和 目标 并 实现 这 些 目标 的 体系 。 

(3) 质量 管理 体系 。 在 质量 方面 指挥 和 控制 组 织 的 管理 体系 。 

根据 ISO 9000 族 标准 约定 的 术语 蔡 代 规则 ,管理 体系 是 建立 方针 和 目标 并 实现 这 些 目 
标的 “相互 关联 或 相互 作用 的 一 组 要 素 ”。 

同样 质量 管理 体系 中 的 “管理 体系 ”也 可 用 管理 体系 的 定义 所 替代 。 

不 难看 出 ,质量 管理 体系 和 管理 体系 都 具有 术语 “体系 ”的 所 有 属性 ,其 实质 都 强调 “ 相 
互 关联 和 相互 作用 的 一 组 要 素 ”, 而 质量 管理 体系 还 具有 管理 体系 的 属性 。 

从 定义 可 看 出 ,质量 管理 体系 具有 以 下 特征 : 

CL) 具有 (在 质量 方面 ) 指 挥 、 控 制 组 织 的 管理 特征 。 

(2) 在 建立 和 实现 (质量 ) 方 针 和 目标 方面 ,具有 明确 的 目标 特征 。 

(3) 与 组 织 的 其 他 管理 体系 一 样 ,其 组 成 要 素 具 有 相互 关联 和 相互 作用 的 体系 特征 。 


> 10.2.3 质量 管理 原则 


由 1. 质量 管理 八 项 原则 


基于 质量 管理 的 理论 和 实践 经 验 , 在 质量 管理 领域 ,形成 了 一 些 有 
影响 的 质量 管理 的 基本 原则 和 思想 。 国 际 标准 化 组 织 (ISO) 结 合 实践 经 
验 及 理论 分 析 , 用 高 度 概括 又 易于 理解 的 语言 .总结 了 质量 管理 的 八 项 
原则 。 这 些 原则 适用 于 所 有 类 型 的 产品 和 组 织 , 成 为 质量 管理 体系 建立 
的 理论 基础 。 

八 项 质量 管理 原则 是 :以 顾客 为 关注 焦点 ;领导 作用 ;全 员 参 与 ;过 
程 方法 ;管理 的 系统 方法 ;持续 改进 :基于 事实 的 决策 方法 :与 供 方 互利 的 关系 。 


fe. 八 项 质量 管理 原则 的 理解 


(1) 以 顾客 为 关注 焦点 。 顾 客 是 组 织 存在 的 基础 ,如 果 组 织 失去 了 顾客 ,就 无 法 生存 下 
去 ,所 以 组 织 应 把 满足 顾客 的 需求 和 期 望 放 在 第 一 位 。 将 其 转化 成 组 织 的 质量 要 求 , 采 取 措 
施 使 其 实现 ;同时 还 应 测量 顾客 的 满意 程度 ,处 理 好 与 顾客 的 关系 ,加 强 与 顾客 的 沟通 ,通过 
采取 改进 措施 ,以 使 顾客 和 其 他 相关 方 满意 。 由 于 顾客 的 需求 和 期 望 是 不 断 变 化 的 ,也 是 因 
人 因 地 而 异 的 ,因此 需要 进行 市 场 调查 ,分 析 市 场 变 化 ,以 此 来 满足 顾客 当前 和 未 来 的 需求 
并 争取 超越 顾客 的 期 望 ,以 创造 竞争 优势 。 

(2) 领导 作用 。 领 导 的 作用 即 最 高 管理 者 具有 决策 和 领导 一 个 组 织 的 关键 作用 。 为 了 
全 体 员工 实现 组 织 的 目标 创造 良好 的 工作 环境 ,最 高 管理 者 应 建立 质量 方针 和 质量 目标 ,以 
体现 组 织 总 的 质量 宗旨 和 方向 ,以 及 在 质量 方面 所 追求 的 目的 。 应 时 刻 关 注 组 织 经 营 的 国 
内 外 环境 ,制定 组 织 的 发 展 战略 ,规划 组 织 的 蓝图 。 质 量 方针 应 随 着 环境 的 变化 而 变化 ,并 
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与 组 织 的 宗旨 相 一 致 。 最 高 管理 者 应 将 质量 方针 、 目 标 传达 落实 到 组 织 的 各 职能 部 门 和 相 
关 层次 ,让 全 体 员工 理解 和 执行 。 

为 了 实施 质量 方针 和 目标 ,组 织 的 最 高 管理 者 应 身体 力行 ,建立 \ 实 施 和 保持 一 个 有 效 
的 质量 管理 体系 ,确保 提供 充分 的 资源 ,识别 影响 质量 的 所 有 过 程 ,并 管理 这 些 过 程 , 使 顾客 
满意 。 

为 了 使 建立 的 质量 管理 体系 保持 其 持续 的 适宜 性 、 充 分 性 和 有 效 性 ,最 高 管理 者 应 亲自 
主持 对 质量 管理 体系 的 评审 ,并 确定 持续 改进 和 实现 质量 方针 、 目 标的 各 项 措施 。 

(3) 全 员 参 与 。 全 体 员工 是 每 个 组 织 的 根本 ,人 是 生产 力 中 最 活跃 的 因素 。 组 织 的 成 
功 不 仅 取决 于 正确 的 领导 ,还 有 赖 于 全 体 人 员 的 积极 参与 。 所 以 应 赋予 各 部 门 , 各 岗位 人 员 
应 有 的 职责 和 权限 ,为 全 体 员工 制造 一 个 良好 的 工作 环境 ,激励 他 们 的 创造 性 和 积极 性 , 通 
ee A TAE EA ee ne a ep 积极 
寻求 增长 知识 和 经 验 的 机 遇 ,为 员工 的 成 长 和 发 展 创造 良好 的 条 件 。 这 样 才 会 给 组 织带 来 
最 大 的 收益 。 

(4) 过 程 方法 。 任 何 使 用 资源 将 输入 转化 为 输出 的 活动 过 程 。 组 织 为 了 有 效 地 运作 ， 
必须 识别 并 管理 许多 相互 关联 的 过 程 。 系 统 地 识别 并 管理 组 织 所 应 用 的 过 程 ,特别 是 这 些 
过 程 之 间 的 相互 作用 , 称 之 为 "过程 方法 ”。 

在 建立 质量 管理 体系 或 制定 质量 方针 和 目标 时 ,应 识别 和 确定 所 需要 的 过 程 ,确定 可 预 
测 的 结果 ,识别 并 测量 过 程 的 输入 和 输出 ,识别 过 程 与 组 织 职能 之 间 的 接口 和 联系 ,明确 规 
定 管 理 过 程 的 职责 和 权限 ,识别 过 程 的 内 部 和 外 部 顾客 ,在 设计 过 程 时 还 应 考虑 过 程 的 步 
了 又、 活动 流程、 控制 措施 .投入 资源 .培训 \ 方 法、 信息 .材料 和 其 他 资源 等 。 只 有 这 样 才 能 充 
分 利用 资源 ,缩短 周期 ,以 较 低 的 成 本 实现 预期 的 结果 。 

(5) 管理 的 系统 方法 。 a ee 互相 关联 的 过 程 组 成 的 网 
络 系统 。 最 高 管理 者 要 成 功 地 领导 和 运作 一 个 组 织 ,要求 用 系统 的 和 透明 的 方式 进行 管理 ， 
CARD A LTT LARNER RM ATE. 

管理 的 系统 方法 包括 了 确定 顾客 的 需求 和 期 望 ,建立 组 织 的 质量 方针 和 目标 ,确定 过 程 
及 过 程 的 相互 关系 和 作用 ,并 明确 职责 和 资源 需求 ,确立 过 程 有 效 性 的 测量 方法 并 用 以 测量 
现行 过 程 的 有 效 性 ,防止 不 合格 ,寻找 改进 机 会 ,确立 改进 方向 ,实施 改进 ,监控 改进 效果 , 评 
价 结果 ,评审 改进 措施 和 确定 后 续 措 施 等 。 这 种 建立 和 实施 质量 管理 体系 的 方法 , 既 可 用 于 
建立 新 体系 ,也 可 用 于 改进 现行 的 体系 。 这 种 方法 不 仅 可 提高 过 程 能 力 及 产品 质量 ,还 可 为 
持续 改进 打 好 基础 ,最 终 导 致 顾客 满意 和 使 组 织 获得 成 功 。 

(6) 持续 改进 。 组 织 所 处 的 环境 是 在 不 断 变化 的 ,科学 技术 在 进步 ,生产 力 在 发 
展 。 人 们 对 物质 和 精神 的 需求 在 不 断 提 高 ,市 场 竞 争 日 趋 激 烈 , 顾 客 的 要 求 越 来 越 高 。 
因此 组 织 应 不 断 调整 自己 的 经 营 战略 和 策略 ,制定 适应 形势 变化 的 策略 和 目标 ,提高 组 
rice 才能 适应 这 样 的 竞争 的 生存 环境 。 所 以 持续 改进 是 组 织 自身 生存 和 发 
展 的 需 

nn 
增加 效益 .追求 持续 提高 过 程 有 效 性 和 效率 的 活动 。 

(7) 基于 事实 的 决策 方法 。 成 功 的 结果 取决 于 活动 实施 之 前 的 精心 策划 和 正确 决 
策 。 决 策 的 依据 应 采用 准确 的 数据 和 信息 ,分 析 或 依据 信息 做 出 判断 是 一 种 良好 的 决策 
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方法 。 在 对 数据 和 信息 进行 科学 分 析 时 ,可 借助 于 其 他 辅助 手段 。 统 计 技术 是 最 重要 的 
TAZ. 

应 用 基于 事实 的 决策 方法 ,首先 应 对 信息 和 数据 的 来 源 进行 识别 ,确保 获得 充分 的 数据 
和 信息 的 渠道 ,并 能 将 得 到 的 数据 正确 方便 地 传递 给 使 用 者 ,做 到 信息 的 共享 ,利用 信息 和 
数据 进行 决策 并 采取 措施 。 其 次 用 数据 说 话 , 以 事实 为 依据 ,有 助 于 决策 的 有 效 性 ,减少 失 
误 并 有 能 力 评 估 和 改变 判断 和 决策 。 

(8) 与 供 方 互利 的 关系 。 供 方 提供 的 产品 对 组 织 向 顾客 提供 满意 的 产品 可 以 产生 重要 
的 影响 。 因 此 把 供 方 ,协作 方 、 合 作 方 都 看 作 是 组 织 经 营 战略 同盟 中 的 合作 伙伴 ,形成 共同 
的 竞争 优势 ,可 以 优化 成 本 和 资源 ,有 利于 组 织 和 供 方 共同 得 到 利益 。 

组 织 在 形成 经 营 和 质量 目标 时 ,应 及 早 让 供 方 参与 合作 ,帮助 供 方 提高 技术 和 管理 水 
平 ,形成 彼此 休戚 相关 的 利益 共同 体 。 
因此 ,需要 组 织 识别 .评价 和 选择 供 方 ,处 理 好 与 供 方 或 合作 伙伴 的 关系 ,与 供 方 共享 技 
术 和 资源 ,加 强 与 供 方 的 联系 和 沟通 ,采取 联合 改进 活动 ,并 对 其 改进 成 果 进 行 肯定 和 鼓励 ， 
都 有 助 于 增强 供需 双方 创造 价值 的 能 力 和 对 变化 的 市 场 做 出 灵活 和 迅速 反应 的 能 力 ,从 而 
达到 优化 成 本 和 资源 。 


> 10. 2.4 1SO 9000 标准 


ISO 9000 族 标 准 的 颁布 ,使 各 国 的 质量 管理 和 质量 保证 活动 统 
e- ISO 9000 族 标准 的 基础 上 。 标 准 总 结 了 工业 发 达 国 家 先进 企业 的 

量 管理 的 实践 经 验 ,统一 了 质量 管理 和 质量 保证 的 术语 和 概念 ,并 对 
ek ee 目标 、 消 除 贸 易 壁 人 又、 提高 产品 
质量 和 顾客 的 满意 程度 等 产生 了 积极 的 影响 ,受到 了 世界 各 国 的 普遍 
KEM RA, SW IE. CERRAHA 150 多 个 国家 和 地 区 等 同 采用 
为 国家 标准 ,并 广泛 用 于 工业 经济 和 政府 的 管理 领域 .有 50 多 个 国家 建立 了 质量 管理 体 
系 认证 制度 ,世界 各 国 质 量 管理 体系 审核 员 注 册 的 互 认 和 质量 管理 体系 认证 的 互 认 制 度 
也 在 广泛 范围 内 得 以 建立 和 实施 。 

GB/T 19000 一 2000《 质 量 管理 体系 基础 和 术语 》(idt ISO 9000:2000)。 此 标准 表述 了 
ISO 9000 族 标准 中 质量 管理 体系 的 基础 ,并 确定 了 相关 的 术语 。 标 准 明 确 了 八 项 质量 管理 

原则 ,是 组 织 改进 其 业绩 的 框架 ,能 帮助 组 织 获得 持续 成 功 ,也 是 ISO 9000 族 质量 管理 体系 
标准 的 基础 。 标 准 表述 了 建立 和 运行 质量 管理 体系 应 遵循 的 12 个 方面 的 质量 管理 体系 基 
础 。 标 准 给 出 了 有 关 质 量 的 术语 共 80 个 词 条 .分 成 10 个 部 分 .阐明 了 质量 管理 领域 所 用 术 
语 的 概念 ,并 提供 了 术语 之 间 的 关系 图 。 

GB/T 19001 一 2000《 质 量 管理 体系 要 求 》(idt ISO 9001:2000) 。 标 准 提供 了 质量 管理 体 
系 的 要 求 , 供 组 织 需 要 证 实 其 具有 稳定 地 提供 满足 顾客 要 求 和 适用 法 律 法 规 要 求 的 产品 的 
能 力 时 使 用 ,组 织 可 通过 体系 的 有 效应 用 ,包括 持续 改进 体系 的 过 程 及 保证 符合 顾客 与 适用 
的 法 规 要 求 ,增强 顾客 满意 。 标 准 应 用 了 以 过 程 为 基础 的 质量 管理 体系 模式 的 结构 ,鼓励 组 
织 在 建立 、 实 施 和 改进 质量 管理 体系 及 提高 其 有 效 性 时 ,采用 过 程 方法 ,通过 满足 顾客 要 求 ， 
增强 顾客 满意 。 过 程 方 法 的 优点 是 对 质量 管理 体系 中 诸多 单个 过 程 之 间 的 联系 及 过 程 的 组 
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合 和 相互 作用 进行 连续 的 控制 ,以 达到 质量 管理 体系 的 持续 改进 。 

GB/T 19004 一 2000《 质 量 管理 体系 业绩 改进 指南 》(idt ISO 9004:2000)。 此 标准 以 八 项 
质量 管理 原则 为 基础 ,帮助 组 织 用 有 效 和 高 效 的 方式 识别 并 满足 顾客 和 其 他 相关 方 的 需求 
和 期 望 , 实 现 保持 和 改进 组 织 的 整体 业绩 ,从 而 使 组 织 获 得 成 功 。 该 标准 提供 了 超出 GB/T 
19001—2000 要 求 的 指南 和 建议 ,不 用 于 认证 或 合同 的 目的 ,也 不 是 GB/T 19001 一 2000 的 
实施 指南 。 标 准 的 结构 也 应 用 了 以 过 程 为 基础 的 质量 管理 体系 模式 ,鼓励 组 织 在 建立 、 实 施 
和 改进 质量 管理 体系 及 提高 其 有 效 性 和 效率 时 ,采用 过 程 方 法 ,以 便 通 过 满足 相关 方 要 求 来 

高 相关 方 的 满意 程度 。 标 准 还 给 出 了 自我 评定 和 持续 改进 过 程 的 示例 ,用 于 帮助 组 织 寻 
找 改 进 的 机 会 ;通过 5 个 等 级 来 评价 组 织 质量 管理 体系 的 成 熟 程度 ;通过 给 出 的 持续 改进 方 
法 ,提高 组 织 的 总 体 业绩 并 使 相关 方 受 益 。 

ISO 19011:2000《 质 量 和 (或 ) 环 境 管 理 体系 审核 指南 )。 标 准 遵循 “不 同 管理 体系 可 以 
有 共同 的 管理 和 审核 要 求 ”" 的 原则 ,为 质量 和 环境 管理 体系 审核 的 基本 原则 ,审核 方案 的 管 
理 、 环 境 和 质量 管理 体系 审核 的 实施 及 对 环境 和 质量 管理 体系 审核 员 的 资格 要 求 提 供 了 指 
南 。 它 适用 于 所 有 运行 质量 和 (或 ) 环 境 管 理 体系 的 组 织 , 指 导 其 内 审 和 外 审 的 管理 工作 。 
该 标准 在 术语 和 内 容 方面 ,兼容 了 质量 管理 体系 和 环境 管理 体系 的 特点 。 在 对 审核 员 的 基 
本 能 力 及 审核 方案 的 管理 中 , 均 增 加 了 应 了 解 及 确定 法 律 和 法 规 的 要 求 。 


Wh 
为 什么 要 认证 ISO 9000 


第 一 ,ISO 9000 族 标准 适应 了 组 织 完善 质量 管理 的 需要 。 任 何 产品 或 服务 都 是 通过 规 
范 或 技术 标准 来 体现 顾客 需要 的 ,但 是 如 果 提 供 和 支持 生产 的 组 织 管理 体系 不 完善 ,就 不 可 
能 始终 如 一 地 生产 出 满足 顾客 要 求 的 产品 。 正 是 由 于 这 方面 的 关注 ,导致 了 ISO 9000 族 标 
准 一 一 质量 体系 标准 的 产生 。 

第 二 ,ISO 9000 族 标 准 体现 了 预防 为 主 的 指导 思想 。 在 ISO 9000 族 标准 的 基本 概念 
中 ,特别 强调 了 过 程控 制 , 即 ISO 9000 族 标准 是 建立 在 所 有 工作 都 是 通过 过 程 来 完成 的 这 
样 一 种 认识 基础 上 。 搁 身 话说 ,所 有 产品 (服务 ) 质 量 也 都 是 在 产品 形成 过 程 中 形成 的 ,要 控 
制 产 品质 量 必须 控制 过 程 ,控制 过 程 体现 了 预防 为 主 这 样 一 种 先进 的 质量 管理 思想 。 

第 三 ,采用 ISO 9000 族 标准 ,可 以 使 质量 管理 规范 化 ,质量 活动 程序 化 实施 ISO 9000， 
就 要 建立 文件 化 的 质量 体系 。 质 量 体 系 对 各 项 活动 的 范围 和 目的 、 做 什么 、 谁 来 做 、 何 时 做 、 
何 地 做 、 如 何 做 、 采 用 什么 设备 和 材料 ,如 何 对 活动 进行 控制 和 记录 等 都 做 出 详细 的 规定 , 作 
到 工作 有 章 可 循 ,有 章 必 循 ,违章 必 纠 。 实 现 从 人治” 到 “法 制 " 的 转变 。 

第 四 ,实施 ISO 9000 族 标准 ,建立 自我 完善 机 制 。 一 个 组 织 实 施 ISO 9000 族 标准 , 建 
立 质量 体系 后 ,可 以 具有 自我 完善 的 功能 。 标 准 要 求 在 建立 质量 体系 后 要 按 要 求 不 间断 
地 进行 内 部 质量 审核 和 管理 评审 。 这 样 就 能 作 到 对 质量 有 效 地 控制 ,能 对 质量 持续 地 实 
现 改 进 。 

ISO 9000 族 标准 不 是 凭空 产生 的 , 它 吸取 了 百年 来 世界 质量 管理 理论 和 实践 的 精华 , 它 
又 是 市 场 经 济 的 产物 ,可 以 有 效 地 提高 组 织 的 市 场 适应 能 力 ,使 企业 处 于 不 败 之 地 。 
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> 10. 2.5 六 西格玛 


20 世纪 80 年 代 后 ,生产 商 认识 到 改进 其 产品 质量 的 重要 性 ,它们 的 目标 达到 了 非常 高 
的 质量 水 平 ,以 至 于 每 百 万 件 产品 出 现 缺陷 的 机 会 不 超过 3. 4。 这 个 质量 水 平 被 称 为 六 西 格 
玛 质 量 水 平 , 达 到 这 个 质量 目标 创建 的 方法 被 称 为 六 西格玛 (six sigma) 。 

六 西格玛 管理 是 一 个 不 断 改 善 的 过 程 。 在 其 标准 下 ,企业 永 不 间断 地 寻求 质量 的 提高 
和 质量 的 稳定 ,而 没有 终点 。 在 这 个 过 程 中 ,企业 要 借助 于 不 同 的 辅助 分 析 工 具 , 使 六 西 格 
玛 的 实施 更 有 效果 。 

总 体 而 言 ,六 西格玛 管理 是 一 个 系统 工程 有 两 个 条 件 不 能 缺少 。 一 是 团队 合作 。 六 西 
格 玛 管理 需要 跨 部 门 ( 跨 企业 ) 的 协调 工作 ,特别 在 这 个 协调 团队 中 一 定 要 包括 一 线 的 工作 
人 员 。 质 量 的 最 终 提 高 必然 涉及 各 个 部 门 乃 至 供应 链 上 各 个 企业 每 一 环节 的 工作 表现 。 这 
就 要 求实 施 单位 跨 部 门 ( 跨 企业 ) 的 联合 团队 共同 发 现 问题 .评估 问题 .解决 问题 。 而 由 于 一 
线 人 员 带 给 我 们 的 是 最 直接 、 最 现实 的 问题 ,他 们 参与 质量 工作 并 与 扁平 化 组 织 紧密 联系 ， 
是 团队 合作 不 可 或 缺 的 。 二 是 领导 层 的 参与 支持 。 与 ISO 9000 质量 体系 的 实施 一 样 ,六 西 
格 玛 必须 得 到 高 层 领 导 的 支持 和 参与 。 否 则 ,六 西格玛 管理 计划 将 无 法 取得 效果 。 六 西 格 
玛 管理 的 实施 必然 涉及 许多 工作 流程 的 调整 .工作 习惯 的 改变 ,要 牵涉 到 个 人 既得 利益 , 因 
而 具体 实施 过 程 会 遇 到 较 大 阻力 。 此 外 ,实施 六 西格玛 会 有 一 定 的 费用 支出 ,而 它 的 作用 体 
现 也 不 会 有 立竿见影 的 效果 。 这 就 容易 使 执行 工作 遇 到 质疑 ,如 果 没 有 领导 层 的 坚定 支持 
并 参与 其 中 ,六 西格玛 的 实施 贯彻 是 很 难 实现 的 。 

在 六 西格玛 的 术语 中 ,缺陷 是 指 传递 给 消费 者 的 任何 错误 和 误差 。 六 西格玛 过 程 将 质 
量 性 能 定义 为 百 万 个 机 会 中 的 缺陷 数 。 为 了 阐明 如 何 测量 这 个 质量 水 平 , 我 们 考虑 CAJ 包 
装 公司 的 一 个 实例 。 

CAJ 公司 经 营 一 条 填 装 宠物 饲料 包装 箱 的 生产 线 。 填 装 过 程 的 均值 为 y= 二 16. 05 千克 , 标 
准 差 为 oc 二 0. 10 千克。 另外 ,假定 填 装 的 重量 服从 正 态 分 布 , 填 装 重量 的 分 布 如 图 10-2 所 示 。 


o0.10 
缺陷 缺陷 
\ id 

15.45 16.05 16.65 


10-2 饲料 箱 填 装 重量 均值 为 p=16. 05 的 正 态 分 布 
假设 管理 人 员 认 为 15. 45 ~ 16. 65 千克 是 填 装 过 程 可 以 接受 的 质量 限 。 因 此 ,小 于 的 
饲料 箱 被 认为 是 有 缺陷 的 。 利 用 均值 和 标准 差 以 及 Excel 的 统计 计算 ,可 以 看 到 
99. 9999998% 的 包装 箱 其 填 装 重量 在 16.05 一 6X0.10 王 15.45( 千 克 ) 一 16.05 十 6X 
0. 10=16. 65( 千 克 ) , 换 句 话说 ,只 有 约 0. 000 000 2% 的 饲料 箱 填 装 重量 小 于 15. 45 千克 
或 大 于 16.65 千克 。 因 此 在 填 装 过 程 中 发 现 有 缺陷 的 饲料 箱 极为 罕见 ,因为 在 1 000 万 
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箱 中 平均 只 有 2 个 箱 存在 缺陷 。 在 六 西格玛 术语 中 ,我 们 说 过 程 的 质量 水 平 是 每 百 万 缺 
陷 机 会 为 3. 4。 如 果 CAJ 的 管理 人 员 认 为 15. 45 一 16. 65 千克 是 填 装 过 程 是 可 以 接受 的 
质量 限 , 则 CAS 填 装 过 程 将 被 认为 是 一 个 六 西格玛 过 程 。 于 是 ,如 果 过 程 均值 停留 在 目 
标 值 “二 16. 05 的 1. 5 个 标准 差 之 内 , 则 可 以 期 待 每 百 万 饲料 箱 中 最 多 只 有 3. 4 箱 存在 
缺陷 。 


10.3 ”统计 过 程控 制 


本 节 我 们 通过 一 个 连续 不 断 制造 货物 的 生产 过 程 来 考虑 质量 控制 程序 。 以 产品 生产 量 
的 抽样 和 检验 为 依据 ,可 以 做 出 是 继续 生产 过 程 还 是 调整 生产 过 程 的 决定 ,使 得 项 目 过 程 在 
生产 的 商品 达到 可 接受 的 质量 标准 。 

尽管 在 制造 和 生产 经 营 中 会 执行 严格 的 高 标准 ,但 机 械 设备 会 不 可 避免 地 被 磨损 ,振动 
将 会 使 机 械 设备 的 装置 难以 调整 ,购买 的 原材料 可 能 有 缺陷 ,操作 人 员 也 可 能 有 失误 。 所 有 
这 些 因 素 可 能 会 导致 低 质量 的 产品 。 幸 和 运 的 是 ,监控 生产 的 程序 是 行 之 有 效 的 ,能 比较 早 地 
检测 出 低 质量 的 产品 ,生产 过 程 因 而 可 以 得 到 调整 或 修正 。 

如 果 所 生产 的 产品 在 质量 上 的 变异 来 源 于 可 指出 的 原因 ,比如 工具 的 磨损 .错误 的 机 器 
安装 、 劣 质 原材料 或 者 操作 人 员 的 失误 等 , 则 应 该 立即 调整 或 修正 生产 过 程 。 另 外 ,如 果 变 
异 来 源 于 所 谓 的 一 般 原因 ,比如 在 原料 、 温 度 和 湿度 等 方面 随机 出 现 的 差异 ,生产 者 可 能 无 
法 控制 ,生产 过 程 也 不 需要 调整 。 统 计 过 程控 制 的 主要 目标 是 确定 产品 的 质量 变异 来 源 于 
可 指出 的 原因 还 是 一 般 原因 。 

无 论 何 时 我 们 发 现 可 指出 的 原因 ,我 们 的 结论 是 ,生产 过 程 处 于 失控 状态 。 在 这 种 情况 
下 ,应 该 采取 纠正 措施 将 生产 过 程 重新 调整 到 可 接受 的 质量 水 平 。 但 是 ,如 果 生 产 过 程 中 的 
产品 变异 仅仅 来 源 于 一 般 原因 ,我 们 的 结论 是 ,生产 过 程 处 于 统计 控制 状态 ,或 简单 地 说 过 
程 处 于 在 控 状 态 。 在 这 种 情况 下 ,我 们 没有 必要 进行 改变 或 者 调整 。 

过 程控 制程 序 依据 的 是 已 经 介绍 过 的 假设 检验 方法 。 原 假设 Ho 表示 生产 过 程 处 于 在 
控 状 态 , 备 择 假设 Hi 表示 生产 过 程 处 于 失控 状态 。 表 10-1 表明 如 何 继续 在 控 状 态 过 程 和 
调整 失控 状态 过 程 ,做 出 正确 的 决定 。 但 是 , 同 其 他 假设 检验 程序 一 样 ,第 一 类 错误 和 第 二 
类 错误 都 有 可 能 发 生 。 


表 10-1 统计 过 程控 制 的 结果 


生产 过 程 状态 
Ho 为 真 ,过 程 在 控 HH 为 假 , 过 程 失控 
第 二 类 错误 
dna — 允许 一 个 失控 状态 过 程 继续 
决定 
P 第 一 类 错误 
HENE 调整 一 个 在 控 状 态 过 程 EMANE 
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10. 3.1 x 控制 图 


控制 图 (control chart) 对 确定 产品 中 的 质 
量 差 异 是 来 源 于 一 般 原因 还 是 来 源 于 可 指出 
的 原因 ,提供 了 一 个 决策 的 基础 。 无 论 任何 时 
候 , 一 旦 检测 出 失控 状态 ,调整 或 其 他 纠正 措 
施 将 使 过 程 重新 回 到 在 控 状态 。 

控制 图 根据 它 所 包含 的 数据 类 型 进行 分 
类 。 如 果 根 据 长 度 \ 重 量 或 温度 等 变量 来 测量 


样本 均值 


中 心 线 


产品 质量 , 则 可 以 使 用 工控 制图 。 在 这 种 情况 时 间 一 一 


下 ,根据 在 产品 样本 中 得 到 的 均值 来 决定 是 继 
续 还 是 调整 过 程 。 


UCL 


处 于 失控 状态 时 
的 过 程 均值 


LCL 


图 10-3 控制 图 结构 


图 10-3 显示 了 工控 制图 的 一 般 结构 。 控 制图 的 中 心 线 表示 处 于 在 失控 过 程 的 均值 , 垂 
直线 表示 要 研究 变量 的 测量 尺度 。 每 次 从 生产 过 程 中 抽取 一 个 样本 ,计算 出 样本 均值 式 , 然 


后 将 表示 工 值 的 数据 点 标 在 控制 图 上 。 


标记 为 UCL 和 LCL 的 两 条 线 , 对 确定 过 程 是 处 于 在 控 状 态 还 是 失控 状态 非常 重要 , 它 


们 分 别 被 称 为 控制 上 限 和 控制 下 限 。 
接 下 来 ,我们 通过 一 个 具体 的 实例 来 讨论 工控 制图 的 应 用 。 


轧钢 厂 生产 的 6 士 0.4Cmm) 厚 度 的 钢板 ,为 测量 这 批 产品 质量 情况 ,技术 人 员 收 集 了 25 
组 产品 数据 ,每 组 5 个 样本 。 数 据 见 表 10-2 所 示 。 
表 10-2 轧钢 厂 钢 板 厚 度 样本 数据 
组 号 z o LEL UCL 
1 5.57 6. 27 5.93 6. 08 6. 03 5. 98 0.26 |5.747 33) 6.209 
2 6.01 6. 04 5. 88 5. 92 6. 16 6. 00 0.11 5.74733] 6.209 
3 5.71 5.75 5. 96 6.19 5. 70 5. 86 0.21 | 5.747 33] 6.209 
4 6.19 6.11 5.74 5. 96 6.17 6. 03 0.19 | 5.747 33] 6.209 
5 6.42 6.13 5.71 5. 96 5. 78 6. 00 0.29 |5.747 33] 6.209 
6 5.92 5.95 5.75 6. 05 5. 94 5.92 0.11 5.74733) 6.209 
7 5. 87 5. 63 5. 80 6.12 6. 32 5.95 0.27 15.747 33| 6.209 
8 5. 89 5.91 6. 00 6. 21 6. 08 6. 02 0.13 |5.747 33] 6.209 
9 5. 96 6. 05 6. 25 5. 89 5. 83 6. 00 0.16 |5.747 33] 6.209 
10 5.95 5.94 6. 07 6. 02 5.75 5.95 0.12 |5.747 33] 6.209 
11 6.12 6.18 6. 10 5.95 5.95 6. 06 0.10 5.74733) 6.209 
12 5.95 5.94 6. 07 6. 00 5.75 5. 94 0.12 |5.747 33| 6.209 
13 5. 86 5. 84 6. 08 6. 24 5. 61 5.93 0.24 |5.747 33] 6.209 
14 6. 13 5. 80 5. 90 5. 93 5. 78 5.91 0.14 |5.747 33] 6.209 
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续 表 
组 号 x o LCL UCL 
15 5. 80 6.14 5.56 6.17 5.97 5. 93 0. 25 5. 747 33] 6.209 
16 6.13 5. 80 5. 90 5. 93 5. 78 5. 91 0. 14 5.747 33| 6.209 
17 5. 86 5. 84 6. 08 6. 24 5. 97 6. 00 0.17 5.747 33] 6.209 
18 5.95 5. 94 6. 07 6. 00 5. 85 5. 96 0. 08 5. 747 33 | 6.209 
19 6.12 6.18 6. 10 5.95 5.95 6. 06 0. 10 5.747 33| 6.209 
20 6. 03 5. 89 5. 97 6. 05 6.45 6. 08 0. 22 5.747 33] 6.209 
21 6.02 6.14 5. 94 5.95 6. 08 6. 03 0. 09 5.747 33] 6.209 
22 6.01 6. 23 5.79 5. 94 6.02 6. 00 0. 16 5.747 33 | 6.209 
23 5.77 6.10 5. 66 6.01 5.92 5. 89 0.18 5.747 33] 6.209 
24 5. 88 5. 94 6.11 6. 23 6. 08 6. 05 0.14 5.747 33] 6.209 
25 6.11 5.98 6. 04 5.99 5.95 6.01 0. 06 5.747 33 | 6.209 


首先 计算 出 每 组 样本 数据 的 平均 值 和 标准 差 。UCL 和 LCL 上 下 限 的 确定 ,根据 正 态 分 
布 的 性 质 , 大 约 有 99.7% 的 正 态 分 布 随机 变量 的 数值 位 于 其 均值 十 3 个 标准 差 的 范围 内 。 
因此 ,如 果 式 的 数值 区 间 在 (jy 一 30z ,w 十 3cz ) 之 间 , 我 们 假设 过 程 处 于 在 控 状态 。 因 此 ,z 控 
制图 的 控制 上 下 限 LCL==y 一 30z =5. 747 ,UCL =p+ 303 =6. 209。 


63r 
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组 号 
10-4 ”轧钢 厂 钢板 厚度 的 x 控制 图 


25 组 样本 数据 的 均值 都 在 控制 限 内 ,我们 确认 抽样 期 间 过 程 的 均值 处 于 在 控 状 态 。 


10. 3.2 直方 图 法 


直方 图 法 是 将 影响 产品 质量 的 各 种 因素 按 其 对 质量 影响 程度 的 大 小 顺序 排列 ,从 而 找 
出 影响 质量 的 主要 因素 。 
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根据 绘制 的 统计 频数 分 布 图 表 , 将 影响 产品 质量 的 众多 影响 因素 按 
其 对 质量 影响 程度 的 大 小 ,用 直方 图 形 顺 序 排列 ,从 而 找 出 主要 因素 。 

其 结构 是 由 两 个 纵 坐 标 和 一 个 横 坐 标 , 若 干 个 直方 形 和 一 条 折线 构 
成 。 左 侧 纵 坐 标 表示 不 合格 品 出 现 的 频数 (出 现 次 数 或 金额 等 ) , 右 侧 纵 
坐标 表示 不 合格 品 出 现 的 累计 频数 (出 现 次 数 或 金额 等 ) , 横 坐 标 表 示 影 
响 质量 的 各 种 因素 , 按 影响 大 小 顺序 排列 ,直方 形 高 度 表 示 相 应 的 因素 


的 影响 程度 ( 即 出 现 频率 为 多 少 ) ,折线 表示 累计 频率 。 通 常 累计 百分比 将 影响 因素 分 为 三 
类 : 占 0% 一 80%% 为 A 类 因素 ,也 就 是 主要 因素 ;80% 一 90 闻 为 B 类 因素 ,是 次 要 因素 ; 
90%~100%W C 类 因素 , 即 一 般 因素 。 由 于 A 类 因素 占 存在 问题 的 80% ,此 类 因素 解决 
了 ,质量 问题 大 部 分 就 得 到 了 解决 。 

某 陶瓷 厂 一 批 产 品 中 发 现 次 品 250 件 ,有 关 质 量 管理 人 员 整 理 资料 见 表 10-3 所 示 。 


表 10-3 陶瓷 厂 次 品 分 布 表 


原因 次 品 数 ( 频 数 )/ 件 频率 累计 频率 
烧 成 200 80% 80% 
成 型 25 10% 90% 
彩 烤 17 6.8% 96.8% 
原料 8 3.2% 100% 


成 型 


彩 烤 原料 
图 10-5 陶瓷 厂 次 品 直方 图 


10.4 接 要 抽样 | 接受 抽样 


在 接受 抽样 中 ,我们 


RM 


TRAN 


趣 的 项 目 可 能 是 正在 进货 的 原材料 或 外 购 的 零 部 件 ,以 及 来 自 


总 装 线 的 制 成 品 。 假 设 我 们 希望 以 指定 的 质量 特性 为 依据 ,决定 是 否 接 受 或 拒绝 一 组 产品 
项 目 。 在 质量 控制 术语 中 ,一 组 项 目 称 为 一 批 ,接受 抽样 是 一 种 统计 方法 ,该 方法 能 使 我 们 


接受 一 拒绝 的 决定 建立 检测 从 一 批 中 抽取 项 目 样本 的 基础 上 。 
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对 


10-6 所 示 是 接受 抽样 的 一 般 步骤 。 


检验 结果 与 指定 的 
质量 满意 质量 特性 比较 质量 不 满意 


送 去 生产 或 消费 对 这 一 批 的 处 理 意 见 


图 10-6 接受 抽样 程序 


在 收 到 一 批 产品 后 ,从 中 抽取 一 个 项 目 样本 进行 检测 。 将 检测 的 结果 与 指定 的 质量 特 
性 进行 比较 。 如 果 质 量 特性 得 到 满足 , 则 接受 这 批 产品 ,并 送 往生 产 线 或 交付 给 客户 。 如 果 
拒绝 这 批 产品 ,管理 人 员 必 须 做 出 如 何 处 置 这 批 产品 的 决定 。 在 一 些 情况 下 ,可 能 决定 保留 
这 批 产品 ,但 是 应 该 剔除 无 法 接受 的 或 者 不 符合 规定 的 项 目 。 在 另 一 些 情况 下 ,可 能 将 这 批 
产品 退回 给 供应 商 , 且 所 有 费用 均 由 供应 商 支 付 。 额 外 的 工作 量 和 费用 记 在 供应 商 名 下 ,能 
激励 供应 商 提供 高 质量 的 产品 。 最 后 ,如 果 拒 绝 的 批 次 中 有 制 成 品 , 则 这 些 制 成 品 必须 报废 
或 者 返工 ,以 达到 可 接受 的 质量 标准 。 

接受 抽样 统计 程序 的 依据 是 假设 检验 方法 。 原 假设 与 备 择 假设 的 陈述 如 下 : 

Ho 表示 高 质量 批 ”Hl 表示 低 质 量 批 

表 10-4 是 假设 检验 程序 的 结果 。 注 意 , 正 确 的 决策 是 接受 一 个 高 质量 批 ,或 者 拒绝 一 
个 低 质 量 批 。 但 是 , 同 其 他 假设 检验 程序 一 样 , 我 们 需要 注意 犯 第 一 类 错误 (拒绝 一 个 高 质 
量 批 ) 或 第 二 类 错误 (接受 一 个 低 质量 批 ) 的 可 能 性 。 


表 10-4 接受 抽样 的 结果 


批 的 状态 
Ho 2 8 «EE E Jy fA 
第 二 类 错误 
z 结 
ee walle ane (接受 一 个 低 质 量 批 ) 
决定 
第 一 类 错误 
结 
EER (拒绝 一 个 高 质量 批 ) EASE 


第 一 类 错误 的 概率 对 批 产品 的 生产 者 造成 风险 ,因此 被 称 为 生产 者 风险 (producer's 
risk) 。 例 如 ,生产 者 风险 为 0.05, 这 意味 着 被 错误 地 拒绝 一 个 高 质量 批 的 可 能 性 为 5%。 另 
一 方面 ,第 二 类 错误 的 概率 对 批 产 品 的 消费 者 造成 风险 ,因此 被 称 为 消费 者 风险 
(consumer's risk) 。 例 如 ,消费 者 风险 为 0.10. 这 意味 着 错误 地 接受 了 一 个 低 质 量 批 的 可 能 
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性 为 10% ,并 且 这 个 低 质量 批 用 于 生产 或 者 出 售 给 消费 者 。 接 受 抽 样 的 程序 可 以 控制 生产 
者 风险 和 消费 者 风险 的 规定 值 。 为 了 说 明 如 何 确 定 风险 值 .下 面 讨论 的 KALUU 公司 的 实 
例 可 以 给 我 们 一 些 启 示 。 

KALUU 公司 是 一 家 电器 生产 商 。 但 是 ,KALUU 并 不 能 制造 且 产 品 所 用 的 每 一 个 部 
件 ,因此 ,需要 从 供应 商 处 购买 一 些 部 件 。 例 如 ,KALUU 购买 的 一 个 部 件 用 于 家 庭 空调 器 
上 的 超载 保护 器 , 它 是 一 种 保护 装置 ,能 在 空调 过 热 时 关闭 压缩 机 。 如 果 过 载 保护 器 运转 不 
正常 , 则 空调 压缩 机 有 可 能 受到 严重 损坏 。 因 此 ,KALUTU 很 关注 超载 保护 器 的 质量 。 保 证 
质量 的 一 种 方法 是 检测 所 收 到 的 每 一 个 部 件 , 这 种 方法 被 称 为 100% 检 验 法 。 但 是 ,为 了 确 
定 一 个 超载 保护 器 正常 运行 ,必须 对 部 件 进行 长 时 间 的 、 费 用 昂贵 的 检验 ,而 且 KALUU 不 
可 能 检测 收 到 的 每 一 个 超载 保护 器 。 

作为 替代 方法 ,KALUU 利用 接受 抽样 方案 来 检测 超载 保护 器 的 质量 。 接 受 抽 样 方案 
BER KALUU 的 质量 控制 检查 员 从 每 批 产 品 中 抽取 样本 并 进行 检验 。 例 如 ,我 们 假设 从 装 
运 的 产品 中 每 次 抽取 15 个 项 目 组 成 样本 。 此 外 ,假设 质量 控制 管理 人 员 表 示 , 仅 在 没有 发 
现 有 缺陷 项 目的 情况 下 才 接 受 该 批 。 这 种 情况 下 ,由 质量 控制 管理 人 员 建 立 的 接受 抽样 方 
RH n=15,c=0. 

这 个 接受 抽样 方案 对 质量 控制 检查 员 来 说 很 容易 实施 。 质 检 员 只 需 抽 取 15 个 项 目 组 
成 样本 ,对 每 一 个 项 目 进行 检验 ,并 根据 以 下 规则 做 出 结论 ; 

(1) 如 果 没 有 发 现 有 缺陷 项 目 , 则 接受 该 批 。 

(2) 如 果 发 现 1 个 或 1 个 以 上 有 缺陷 项 目 , 则 拒 收 该 批 。 

在 实施 接受 抽样 方案 之 前 ,质量 控制 管理 人 员 和 希望 评估 该 方案 的 风险 或 改良 版 。 只 有 
生产 者 风险 (第 一 类 错误 ) 和 消费 者 风险 (第 二 类 错误 ) 都 控制 在 一 个 合理 水 平 ,这 个 方案 才 
能 得 以 实施 。 

计算 接受 一 批 的 概率 时 ,我 们 假设 已 知 一 批 中 有 缺陷 项 目的 百分比 ,对 于 给 定 的 抽样 方 
案 , 计 算 接受 这 批 的 概率 。 通 过 改变 假设 的 有 缺陷 项 目的 百分比 ,我 们 可 以 检验 抽样 方案 关 
于 两 类 风险 的 影响 。 

对 于 有 缺陷 项 目 数 服从 一 个 二 项 分 布 , 概 率 函 数 是 


! 
WD ape (0-1) 


式 中 ,n 代表 样本 容量 ;代表 批 中 有 缺陷 项 目的 比例 :z 代表 样本 中 有 缺陷 项 目的 个 
数 ,f(z) 代 表 样 本 中 有 z 个 有 缺陷 项 目的 概率 。 

假设 我 们 已 经 收 到 大 批量 的 超载 保护 器 , 且 其 中 有 5% 的 超载 保护 器 有 缺陷 ,对 
KALUU 的 接受 抽样 方案 ,n= 二 15, 对 有 缺陷 项 目 5%(p 二 0.05) 的 一 批 ,我 们 有 


15! I gjasa) 
ET] 5-2)” 05 (1—0. 05) (10-2) 


当 0 个 超载 保护 器 有 缺陷 ,并 且 接 受 该 批 的 概率 ,因此 有 


15! 
0! (15—0)! 


我 们 现在 知道 ,对 n= 15 c= 0 的 接受 抽样 方案 ,有 缺陷 项 目 为 5%% 的 一 批 ,接受 的 概率 
为 0.463 3。 因 此 ,有 缺陷 项 目 5% 的 一 批 , 拒 绝 的 概率 为 1 一 0. 463 3 一 0. 536 7。 
二 项 式 概率 表 可 以 减少 确定 接受 一 批 概率 的 计算 量 。 表 10-5 列 出 了 n= 二 15 Ail n=20 的 
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部 分 二 项 概率 。 利 用 这 个 表 . 我 们 能 确定 ,有 缺陷 项 目 为 10% ,对 于 ==15,c 二 0 的 抽样 方案 
接受 这 批 的 概率 为 0.2059。 如 果 有 缺陷 项 目 分 别 是 1% 2% 3% + REF n=15,.c=0 的 


抽样 方案 接受 这 批 的 概率 值 都 可 以 从 表 10-5 查 到 。 


表 10-5 样本 容量 为 15 和 20 的 部 分 二 项 式 概率 


n a | p=0.01| p=0. 02] p=0. 03| p=0. 04| p=0. 05 | p=0. 10 | p=0. 15 | p=0. 20 | p=0. 25 
o [0.860 1] 0. 738 6 | 0. 633 3 | 0. 542 1 | 0. 463 3 | 0.205 9 | 0. 087 4 | 0. 035 2 | 0. 013 4 
1 [0.130 3 | 0. 226 1 | 0. 293 8 | 0. 338 8 | 0. 365 8 | 0. 343 2 | 0. 231 2 | 0. 131 9 | 0. 066 8 
2 [0.009 2 | 0.032 3 | 0. 063 6 | 0. 098 8 | 0. 134 8 | 0. 266 9 | 0. 285 6 | 0. 230 9 | 0. 155 9 
3 [0.000 4 | 0. 002 9 | 0. 008 5 | 0. 017 8 | 0. 030 7 | 0. 128 5 | 0. 218 4 | 0. 250 1 | 0. 225 2 
4 [0.000 0 | 0. 000 2 | 0. 000 8 | 0. 002 2 | 0. 004 9 | 0.042 8 | 0. 115 6 | 0. 187 6 | 0. 225 2 
15 5 |0. 000 o | 0. 000 o | 0. 000 1 | 0. 000 2 | 0. 000 6 | 0.010 5 | 0. 044 9 | 0. 103 2 | 0. 165 1 
6 [0.000 o | 0.000 o | 0. 000 o | 0. 000 o | o. 000 o | 0.001 9 | 0.013 2 | 0. 043 0 | 0,091 7 
7 [0.000 0 | 0. 000 o | 0.000 o | o. 000 o | 0. 000 o | 0. 000 3 | 0. 003 o | o. 013 8 | 0. 039 3 
8 — | 0.000 o | 0. 000 o | 0. 000 o | 0. 000 o | 0. 000 o | 0.000 o | 0. 000 5 | 0.003 5 | 0.013 1 
9 [0.000 0| 0. 000 o | 0. 000 o | 0. 000 o | 0. 000 o | o. 000 o | 0. 000 1 |0. 000 7 | 0. 003 4 
10 [0.000 0 | 0. 000 0 | 0. 000 o | 0. 000 o | 0. 000 o | o. 000 o | 0. 000 o | 0. 000 1 | 0. 000 7 
n x | p=0.01| p=0. 02| p=0. 03| p=0. 04| p=0. 05 | p=0. 10 | p=0. 15 | p=0. 20] p=0. 25 
0 [0.817 9 | 0. 667 6 | 0. 543 8 | 0. 442 0 | 0. 358 5 | 0. 121 6 | 0. 038 8 | 0. 011 5 | 0. 003 2 
1 [0.165 2 | 0. 272 5 | 0. 336 4 | 0. 368 3 | 0. 377 4 | 0. 270 2 | 0. 136 8 | 0.057 6 | 0. 021 1 
2 | 0.015 9 | 0. 052 8 | 0. 098 8 | 0. 145 8 | 0. 188 7 | 0. 285 2 | 0. 229 3 | 0. 136 9 | 0. 066 9 
3 [0.001 0| 0,006 5 | 0. 018 3 | 0. 036 4 | 0. 059 6 | 0. 190 1 | 0. 242 8 | 0. 205 4 | 0. 133 9 
4 [0.000 0 | 0. 000 6 | 0. 002 4 | 0. 006 5 | 0. 013 3 | 0. 089 8 | 0. 182 1 | 0. 218 2 | 0. 189 7 
5 [0.000 0| 0. 000 o | 0. 000 2 | 0. 000 9 | 0. 002 2 | 0.031 9 | 0. 102 8 | 0. 174 6 | 0. 202 3 
6 [0.000 0| 0.000 o | 0. 000 o | 0. 000 1 | 0. 000 3 | 0. 008 9 | 0. 045 4 | 0. 109 1 | 0. 168 6 
a 7 | 0.000 0 | 0. 000 0 | 0. 000 o | o. 000 o | 0. 000 o | 0. 002 0 | 0. 016 0 | 0.054 5 | 0. 112 4 
8 [0.000 o | 0. 000 o | 0. 000 o | 0. 000 o | 0. 000 o | 0. 000 4 | 0. 004 6 | 0. 022 2 | 0.060 9 
9 [0.000 o | 0.000 o | 0. 000 o | o. 000 o | 0. 000 o | 0.000 1 | 0. 001 1 | 0. 007 4 | 0. 027 1 
10 |0. 000 0 | 0. 000 0 | 0. 000 o | 0. 000 o | 0. 000 o | 0. 000 o | 0. 000 2 | 0. 002 0 | 0. 009 9 
11 |0. 000 0 | 0. 000 0 | 0. 000 o | 0. 000 0 | 0. 000 o | 0. 000 o | 0. 000 o | 0. 000 5 | 0. 003 0 
12 |0. 000 0 | 0. 000 0 | 0. 000 o | 0. 000 o | 0. 000 o | 0. 000 o | 0. 000 o | 0. 000 1 | 0. 000 8 
13 | 0.000 0 | 0. 000 o | 0. 000 o | 0. 000 o | 0. 000 o | 0. 000 o | 0. 000 o | 0. 000 0 | 0. 000 2 


根据 表 10-5 的 二 项 式 概率 ,将 接受 一 批 的 概率 和 批 中 有 缺陷 项 目的 百分比 绘制 成 


图 10-7。 这 个 图 


形 或 曲线 ,被 称 为 zx 一 15,c 一 0 的 抽样 方案 的 抽样 特性 曲线 。 
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表 10-6 n=15,c=0 的 抽样 方案 接受 一 批 的 概率 


批 中 有 缺陷 项 目的 百分比 接受 一 批 的 概率 批 中 有 缺陷 项 目的 百分比 接受 一 批 的 概率 
1 0. 860 1 10 0. 205 9 
2 0.738 6 15 0.087 4 
3 0.633 3 20 0. 035 2 
4 0.542 1 25 0.013 4 
5 0. 463 3 30 0.0047 

1.00 
0.90 
0.80 
0.70 
= 0.60 
2 0.50 
& 0.40 
$ 030 
0.20 
0.10 
0.00 
0% 5% 10% 15% 20% 25% 
批 中 有 缺陷 项 目的 百分比 


图 10-7 n=15,c=0 的 抽样 方案 的 抽样 特性 曲线 

现在 我 们 已 经 知道 如 何 使 用 二 项 式 分 布 , 根 据 一 个 给 定 的 有 缺陷 项 目的 比例 来 计算 接 
受 一 批 的 概率 。 对 于 正在 研究 的 应 用 ,我 们 已 经 选 好 n 和 c 的 数值 来 确定 所 需 用 的 接受 抽 
样 方案 。 为 了 制订 这 个 方案 ,管理 人 员 必 须 对 批 中 有 缺陷 项 目的 比例 指定 两 个 数值 。 一 个 
数值 用 于 控制 生产 者 风险 ; 另 一 个 数值 证 用 于 控制 消费 者 风险 。 

我 们 使 用 如 下 记号 : 

a 一 一 生产 者 风险 ,拒绝 有 缺陷 比例 为 po 的 一 批 概率 ; 

8 一 一 消费 者 风险 ,接受 有 缺陷 比例 为 pi 的 一 批 概率 。 

假设 在 KALUU 问题 中 ,管理 人 员 规 定 po = 0.03. p,=0.15. ME 10-8 中 ”一 15， 
< 一 0 的 抽样 方案 的 抽样 特性 曲线 中 ,我们 可 以 看 到 po =0. 03 给 出 的 生产 者 风险 大 约 是 
1—0. 63=0. 37, p,=0. 15 给 出 的 消费 者 风险 大 约 是 0.09。 因 此 ,如 果 管 理 人 员 愿 意 承 
担 拒 绝 有 缺陷 项 目 比 例 为 3% 的 一 批 的 概率 为 0. 37( 生 产 者 风险 ), 同 时 承受 接受 有 缺陷 
项 目 比 例 为 15% 的 一 批 概率 为 0.09( 消 费 者 风险 ), 则 ,n= 二 15,c==0 的 抽样 方案 是 可 以 接 
受 的 。 

正如 上 述 讨 论 的 例子 ,在 决定 抽样 方案 时 .我 们 需要 结合 预期 的 生产 者 风险 和 消费 者 风 
险 , 考 虑 一 些 计 算 和 抽样 特性 曲线 。 管 理 人 员 可 以 要 求生 产 者 风险 和 消费 者 风险 预期 更 小 
的 方案 ,以 满足 生产 者 风险 和 消费 者 风险 的 需要 。 


ae 


本 项 目 我 们 讨论 了 统计 方法 如 何 应 用 于 质量 管理 控制 。 介 绍 了 用 工控 制图 和 直方 图 来 
检测 生产 过 程 。 对 控制 图 确定 的 控制 限 ,定期 抽取 样本 ,并 将 数据 描绘 在 控制 图 上 。 当 数据 
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项 目 10 ”质量 管理 的 统计 方法 il 


呈 生 产 者 风险 ( 犯 第 一 类 错误 的 概率 ) 
Q ”消费 者 风险 ( 犯 第 二 类 错误 的 概率 ) 


0.00 Peis paid La ' 
0% | 5% 10% a 20% 25% 


deste MOTD 
图 10-8 = n=15,c=0, po =0. 03, pı =0. 15 的 抽样 特性 曲线 
点 位 于 控制 限 之 外 时 ,表明 过 程 处 于 失控 状态 ,必须 采取 纠正 措施 。 在 控制 限 之 内 的 数据 点 
的 模式 ,也 能 指出 潜在 的 质量 控制 问题 ,纠正 措施 的 建议 可 能 是 必要 的 。 
本 项 目 还 讨论 了 被 称 为 接受 抽样 的 技术 ,根据 接受 抽样 程序 抽取 并 检验 一 个 样本 。 样 
本 中 有 缺陷 项 目的 个 数 提供 了 接受 或 拒绝 一 批 的 依据 。 为 控制 生产 者 风险 (第 一 类 错误 ) 和 
消费 者 风险 (第 二 类 错误 ) ,可 以 调整 样本 容量 和 接受 准则 。 
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1. 对 一 个 处 于 在 控 状态 的 生产 过 程 抽 取 20 个 容量 为 5 的 样本 ,得 到 如 下 的 样本 均值 资料 。 

95.72 95.24 95.18 95.44 95.46 95.32 95.40 95.44 95.08 95.50 

95.80 95.22 95.56 95.22 95.04 95.72 94.82 95.46 95.60 95.78 

(1) 根据 这 些 数据 , 当 过 程 处 于 在 控 状 态 时 ,均值 的 估计 值 是 多 少 ? 

(2) 假设 过 程 的 标准 关 o = 0. 15, 构 造 该 生产 过 程 的 控制 图 。 假 设 过 程 的 均值 为 估 
计 值 。 

(3) 这 20 个 样本 的 均值 是 否 表明 过 程 处 于 失控 状态 ? 

2. 1 200 个 零售 商店 的 管理 人 员 从 中 心 仓库 每 月 做 两 次 进货 订单 。 过 去 的 经 验 表 明 ， 
4% 的 订单 至 少 有 1 个 错误 ,如 产品 装运 错误 装运 数量 错误 和 漏 装 了 已 预订 的 产品 。 每 个 
月 抽取 200 份 订单 组 成 的 随机 样本 ,并 且 进 行 准确 性 检验 。 

(1) 构造 这 种 情况 控制 图 。 

(2) 下 面 是 6 个 月 至 少 有 1 个 错误 的 订单 数 :10、15、6、13、8、17。 将 这 些 数 据 绘制 在 控 
制图 上 。 对 于 订单 过 程 ,你 的 控制 图 说 明了 什么 问题 ? 

3. 设计 的 接受 抽样 方案 为 n= 二 15,c==1, 生 产 者 风险 为 0.075。 

C) po 的 值 是 0.01、0.02、0.03、0.04 或 0.05 吗 ? 这 个 值 意味 着 什么 ? 

(2) 如 果 pı =0. 25 ,这 个 方案 的 消费 者 风险 是 多 少 ? 


表 1 标准 正 态 分 布 曲线 ( 单 侧 ) 下 面积 与 概率 

z 0. 00 0.01 0. 02 0. 03 0. 04 0.05 0. 06 0. 07 0. 08 0. 09 
0.0 0. 000 0 | 0. 004 0 | 0. 008 0 | 0.012 O | 0. 016 0 | 0.019 9 | 0.023 9 | 0. 027 9 | 0.031 9 | 0.035 9 
0.1 0. 039 8 | 0.043 8 | 0. 047 8 | 0.051 7 | 0.055 7 | 0. 059 6 | 0. 063 6 | 0. 067 5 | 0.071 4 | 0.075 3 
0. 2 0. 079 3 | 0. 083 2 | 0. 087 1 | 0.091 0 | 0. 094 8 | 0. 098 7 | 0. 102 6 | 0.106 4 | 0.110 3 | 0.1141 
0. 3 0.117 9 | 0.121 7 | 0.125 5 | 0.129 3 | 0. 133 1 | 0.136 8 | 0.140 6 | 0. 144 3 | 0. 148 O | 0. 151 7 
0.4 0. 155 4 | 0. 159 1 | 0. 162 8 | 0. 166 4 | 0. 170 O | 0. 173 6 | 0. 177 2 | 0. 180 8 | 0. 184 4 | 0. 187 9 
0.5 0. 191 5 | 0. 195 0} 0.198 5 | 0. 201 9 | 0. 205 4 | 0. 208 8 | 0. 212 3 | 0. 215 7 | 0. 219 O | 0. 222 4 
0.6 0. 225 7 | 0.229 1 | 0. 232 4 | 0. 235 7 | 0. 238 9 | 0. 242 2 | 0. 245 4 | 0. 248 6 | 0. 251 7 | 0. 254 9 
OF 0. 258 0 | 0. 261 1 | 0. 264 2 | 0. 267 3 | 0. 270 4 | 0. 273 4 | 0.276 4 | 0. 279 4 | 0. 282 3 | 0. 285 2 
0.8 0. 288 1 | 0. 291 0} 0. 293 9 | 0. 296 7 | 0. 299 5 | 0. 302 3 | 0. 305 1 | 0. 307 8 | 0. 310 6 | 0. 313 3 
0.9 0. 315 9 | 0. 318 6 | 0. 321 2 | 0.323 8 | 0. 326 4 | 0. 328 9 | 0.331 5 | 0. 334 0 | 0. 336 5 | 0. 338 9 
1.0 0. 341 3 | 0. 343 8 | 0. 346 1 | 0. 348 5 | 0. 350 8 | 0. 353 1 | 0. 355 4 | 0. 357 7 | 0. 359 9 | 0. 362 1 
1,1 0. 364 3 | 0. 366 5 | 0. 368 6 | 0.370 8 | 0. 372 9 | 0. 374 9 | 0. 377 0 | 0. 379 0 | 0. 381 0 | 0. 383 0 
1.2 0. 384 9 | 0. 386 9 | 0. 388 8 | 0. 390 7 | 0. 392 5 | 0. 394 4 | 0. 396 2 | 0. 398 O | 0. 399 7 | 0. 401 5 
1.3 0. 403 2 | 0. 404 9 | 0. 406 6 | 0. 408 2 | 0. 409 9 | 0. 411 5 | 0. 413 1 | 0.414 7 | 0. 416 2 | 0. 417 7 
1.4 0. 419 2 | 0. 420 7 | 0. 422 2 | 0. 423 6 | 0. 425 1 | 0. 426 5 | 0. 427 9 | 0. 429 2 | 0. 430 6 | 0. 431 9 
1.5 0. 433 2 | 0. 434 5 | 0. 435 7 | 0. 437 0 | 0. 438 2 | 0. 439 4 | 0. 440 6 | 0. 441 8 | 0. 442 9 | 0. 444 1 
1.6 0. 445 2 | 0. 446 3 | 0. 447 4 | 0. 448 4 | 0. 449 5 | 0. 450 5 | 0. 451 5 | 0. 452 5 | 0. 453 5 | 0. 454 5 
1.7 0. 455 4 | 0. 456 4 | 0. 457 3 | 0. 458 2 | 0. 459 1 | 0. 459 9 | 0. 460 8 | 0. 461 6 | 0. 462 5 | 0. 463 3 
1.8 0. 464 1 | 0. 464 9 | 0. 465 6 | 0. 466 4 | 0. 467 1 | 0. 467 8 | 0. 468 6 | 0. 469 3 | 0. 469 9 | 0. 470 6 
1.9 0. 471 3 | 0. 471 9 | 0. 472 6 | 0. 473 2 | 0. 473 8 | 0. 474 4 | 0. 475 0 | 0. 475 6 | 0. 476 1 | 0.4767 
2.0 0. 477 2 | 0. 477 8 | 0. 478 3 | 0. 478 8 | 0. 479 3 | 0. 479 8 | 0. 480 3 | 0. 480 8 | 0. 481 2 | 0. 481 7 
2.1 0. 482 1 | 0. 482 6 | 0. 483 0 | 0. 483 4 | 0. 483 8 | 0. 484 2 | 0. 484 6 | 0. 485 0 | 0. 485 4 | 0. 485 7 
2.2 0. 486 1 | 0. 486 4 | 0. 486 8 | 0. 487 1 | 0. 487 5 | 0. 487 8 | 0. 488 1 | 0. 488 4 | 0. 488 7 | 0. 489 0 
2.3 0. 489 3 | 0. 489 6 | 0. 489 8 | 0. 490 1 | 0. 490 4 | 0. 490 6 | 0.490 9 | 0.491 1 | 0.491 3 | 0. 491 6 
2.4 0. 491 8 | 0. 492 O | 0. 492 2 | 0. 492 5 | 0. 492 7 | 0. 492 9 | 0. 493 1 | 0. 493 2 | 0. 493 4 | 0. 493 6 
2.5 0. 493 8 | 0. 494 O | 0. 494 1 | 0. 494 3 | 0. 494 5 | 0. 494 6 | 0. 494 8 | 0. 494 9 | 0. 495 1 | 0. 495 2 
2.6 0. 495 3 | 0. 495 5 | 0. 495 6 | 0. 495 7 | 0. 495 9 | 0. 496 O | 0. 496 1 | 0. 496 2 | 0. 496 3 | 0. 496 4 
2.7 0. 496 5 | 0. 496 6 | 0. 496 7 | 0.496 8 | 0.496 9 | 0.497 0 | 0.497 1 | 0. 497 2 | 0.497 3 | 0. 497 4 
2.8 0.497 4 | 0.497 5 | 0.497 6 | 0.497 7 | 0.497 7 | 0.497 8 | 0.497 9 | 0. 497 9 | 0. 498 0 | 0. 498 1 
2.9 0. 498 1 | 0. 498 2 | 0. 498 2 | 0. 498 3 | 0.498 4 | 0.498 4 | 0.498 5 | 0. 498 5 | 0. 498 6 | 0. 498 6 
3.0 0. 498 7 | 0.498 7 | 0. 498 7 | 0. 498 8 | 0. 498 8 | 0. 498 9 | 0.498 9 | 0. 498 9 | 0. 499 0 | 0. 499 0 

R2 上 分 布 临界 值 表 

df/a 0. 200 0. 150 0. 100 0. 050 0. 025 0. 010 0. 005 0. 001 0. 000 5 

1 1. 376 1. 963 3. 078 6.314 12.706 | 31.821 | 63.657 |318. 309 636. 619 

2 1.061 1. 386 1. 886 2. 920 4. 303 6. 965 9.925 22. 327 31. 599 

3 0. 978 1. 250 1. 638 2. 353 3. 182 4. 541 5. 841 10. 215 12. 924 

4 0. 941 1. 190 1. 533 2.132 2.776 3. 747 4. 604 7.173 8. 610 

5 0. 920 1. 156 1. 476 2.015 2.571 3. 365 4. 032 5. 893 6. 869 
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续 表 
df/a 0. 200 0. 150 0. 100 0. 050 0. 025 0. 010 0. 005 0. 001 0. 000 5 

6 0. 906 1. 134 1. 440 1. 943 2. 447 3. 143 3. 707 5. 208 5. 959 
7 0. 896 1,199 1.415 1. 895 2. 365 2. 998 3. 499 4. 785 5. 408 
8 0. 889 1. 108 1. 397 1. 860 2. 306 2. 896 3.355 4. 501 5. 041 
9 0. 883 1. 100 1. 383 1. 833 2. 262 2. 821 3. 250 4. 297 4.781 
10 0. 879 1. 093 1. 372 1.812 2. 228 2. 764 3. 169 4. 144 4. 587 
11 0. 876 1. 088 1. 363 1.796 2. 201 2.718 3. 106 4, 025 4. 437 
12 0. 873 1. 083 1. 356 1. 782 2.179 2. 681 3. 055 3. 930 4. 318 
13 0. 870 1.079 1. 350 1771 2. 160 2. 650 3.012 3. 852 4,221 
14 0. 868 1. 076 1. 345 1.761 2. 145 2. 624 2. 977 3. 787 4. 140 
15 0. 866 1. 074 1. 341 1. 753 2. 131 2. 602 2. 947 3. 733 4. 073 
16 0. 865 1. 071 1. 337 1. 746 2. 120 2. 583 2. 921 3. 686 4,015 
17 0. 863 1. 069 1. 333 1.740 2.110 2. 567 2. 898 3. 646 3. 965 
18 0. 862 1. 067 1. 330 1. 734 2. 101 2. 552 2. 878 3. 610 3. 922 
19 0. 861 1. 066 1. 328 1.729 2. 093 2. 539 2. 861 3.579 3. 883 
20 0. 860 1. 064 1, 325 1,725 2. 086 2,528 2. 845 3. 552 3. 850 
21 0. 859 1. 063 1. 323 1.721 2. 080 2. 518 2. 831 3. 527 3. 819 
22 0. 858 1. 061 1. 321 1.717 2. 074 2. 508 2. 819 3. 505 3. 792 
23 0. 858 1. 060 1. 319 1.714 2. 069 2. 500 2. 807 3. 485 3. 768 
24 0. 857 1. 059 1. 318 1.711 2. 064 2. 492 2. 797 3. 467 3.745 
25 0. 856 1. 058 1. 316 1. 708 2. 060 2. 485 2. 787 3. 450 3.725 
26 0. 856 1. 058 1. 315 1. 706 2. 056 2. 479 2. 779 3. 435 3. 707 
27 0. 855 1. 057 1. 314 1. 703 2. 052 2. 473 2.771 3. 421 3. 690 
28 0. 855 1. 056 1. 313 1.701 2. 048 2, 467 2. 763 3. 408 3. 674 
29 0. 854 1.055 1, 311 1.699 2. 045 2. 462 2. 756 3. 396 3. 659 
30 0. 854 1.055 1, 310 1. 697 2. 042 2. 457 2. 750 3. 385 3. 646 
31 0. 853 1. 054 1. 309 1. 696 2. 040 2. 453 2. 744 3. 375 3. 633 
32 0. 853 1. 054 1. 309 1. 694 2. 037 2. 449 2. 738 3. 365 3. 622 
33 0. 853 1. 053 1. 308 1. 692 2. 035 2. 445 2. 733 3. 356 3.611 
34 0. 852 1. 052 1. 307 1.691 2. 032 2.441 2.728 3. 348 3. 601 
35 0. 852 1. 052 1. 306 1. 690 2. 030 2. 438 2. 724 3. 340 3.591 
36 0. 852 1. 052 1. 306 1. 688 2. 028 2. 434 2:719 3. 333 3. 582 
37 0. 851 1. 051 1. 305 1. 687 2. 026 2. 431 2.715 3. 326 3.574 
38 0. 851 1.051 1. 304 1. 686 2. 024 2. 429 2.712 3. 319 3. 566 
39 0. 851 1. 050 1. 304 1. 685 2. 023 2. 426 2. 708 3. 313 3. 558 
40 0. 851 1. 050 1. 303 1. 684 2. 021 2. 423 2. 704 3. 307 3.551 
41 0. 850 1.050 1. 303 1. 683 2. 020 2. 421 2.701 3. 301 3. 544 
42 0. 850 1. 049 1. 302 1. 682 2.018 2.418 2. 698 3. 296 3. 538 
43 0. 850 1. 049 1. 302 1. 681 2.017 2.416 2. 695 3.291 3. 532 
44 0. 850 1. 049 1. 301 1. 680 2.015 2.414 2. 692 3. 286 3. 526 
45 0. 850 1. 049 1. 301 1.679 2.014 2.412 2.690 3. 281 3. 520 
46 0. 850 1. 048 1. 300 1.679 2.013 2. 410 2. 687 3.277 3.515 


df/a 0. 200 0. 150 0. 100 0. 050 0. 025 0. 010 0. 005 0. 001 0. 000 5 
47 0. 849 1. 048 1. 300 1. 678 2.012 2. 408 2. 685 3. 273 3.510 
48 0. 849 1. 048 1, 299 1.677 2.011 2. 407 2. 682 3. 269 3. 505 
49 0. 849 1. 048 1. 299 1. 677 2. 010 2. 405 2. 680 3. 265 3. 500 
50 0. 849 1. 047 1. 299 1.676 2. 009 2. 403 2.678 3. 261 3. 496 
51 0. 849 1. 047 1. 298 1.675 2. 008 2. 402 2. 676 3. 258 3. 492 
52 0. 849 1. 047 1. 298 1.675 2. 007 2. 400 2. 674 3. 255 3. 488 
53 0. 848 1. 047 1. 298 1. 674 2. 006 2. 399 2. 672 3. 251 3. 484 
54 0. 848 1. 046 1. 297 1. 674 2. 005 2. 397 2.670 3. 248 3. 480 
55 0. 848 1. 046 1. 297 1. 673 2. 004 2. 396 2. 668 3. 245 3. 476 
56 0. 848 1. 046 1. 297 1. 673 2. 003 2. 395 2. 667 3. 242 3. 473 
57 0. 848 1. 046 1. 297 1.672 2. 002 2. 394 2. 665 3. 239 3. 470 
58 0. 848 1. 046 1. 296 1.672 2. 002 2. 392 2. 663 3. 237 3. 466 
59 0. 848 1. 046 1. 296 1. 671 2. 001 2. 391 2. 662 3. 234 3. 463 
60 0. 848 1. 045 1. 296 1.671 2. 000 2. 390 2. 660 3. 232 3. 460 
61 0, 848 1. 045 1. 296 1. 670 2. 000 2. 389 2. 659 3. 229 3. 457 
62 0. 847 1. 045 1. 295 1. 670 1:999 2. 388 2. 657 3. 227 3. 454 
63 0. 847 1. 045 1. 295 1. 669 1. 998 2. 387 2. 656 3. 225 3. 452 
64 0. 847 1. 045 1. 295 1. 669 1,998 2. 386 2. 655 3. 223 3. 449 
65 0. 847 1. 045 1. 295 1. 669 1.997 2. 385 2. 654 3. 220 3. 447 
66 0. 847 1. 045 1. 295 1. 668 1.997 2. 384 2. 652 3. 218 3. 444 
67 0. 847 1. 045 1. 294 1. 668 1. 996 2. 383 2. 651 3. 216 3. 442 
68 0. 847 1. 044 1. 294 1. 668 1. 995 2. 382 2. 650 3. 214 3. 439 
69 0. 847 1. 044 1. 294 1. 667 1. 995 2, 382 2. 649 3. 213 3. 437 
70 0. 847 1. 044 1, 294 1. 667 1.994 2. 381 2. 648 3.211 3. 435 
ra 0. 847 1. 044 1. 294 1. 667 1. 994 2. 380 2. 647 3. 209 3. 433 
72 0. 847 1. 044 1. 293 1. 666 1. 993 2. 379 2. 646 3. 207 3. 431 
73 0. 847 1. 044 1. 293 1. 666 1. 993 2. 379 2. 645 3. 206 3. 429 
74 0. 847 1. 044 1. 293 1. 666 1. 993 2. 378 2. 644 3. 204 3. 427 
75 0. 846 1. 044 1. 293 1. 665 1.992 2. 377 2. 643 3. 202 3.425 
76 0. 846 1. 044 1. 293 1. 665 1: 992 2. 376 2. 642 3. 201 3. 423 
77 0. 846 1. 043 1. 293 1. 665 1990 2. 376 2. 641 3. 199 3. 421 
78 0. 846 1. 043 1. 292 1. 665 1.991 2. 375 2. 640 3. 198 3. 420 
79 0. 846 1. 043 1. 292 1. 664 1. 990 2. 374 2. 640 3. 197 3. 418 
80 0. 846 1. 043 1. 292 1. 664 1. 990 2. 374 2. 639 3. 195 3.416 
81 0. 846 1. 043 1. 292 1. 664 1. 990 2. 373 2. 638 3. 194 3.415 
82 0. 846 1. 043 1. 292 1. 664 1. 989 2. 373 2. 637 3. 193 3.413 
83 0. 846 1. 043 1. 292 1. 663 1. 989 2. 372 2. 636 3. 191 3. 412 
84 0. 846 1. 043 1. 292 1. 663 1. 989 2.372 2. 636 3. 190 3. 410 
85 0. 846 1. 043 1. 292 1. 663 1. 988 2.371 2. 635 3. 189 3. 409 
86 0. 846 1. 043 1.291 1. 663 1. 988 2. 370 2. 634 3. 188 3. 407 
87 0. 846 1. 043 1.291 1. 663 1. 988 2. 370 2. 634 3. 187 3. 406 
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续 表 
df/a 0. 200 0.150 0. 100 0. 050 0. 025 0. 010 0. 005 0. 001 0. 000 5 

88 0. 846 1. 043 1. 291 1. 662 1. 987 2. 369 2. 633 3. 185 3. 405 
89 0. 846 1. 043 1, 291 1. 662 1. 987 2. 369 2. 632 3. 184 3. 403 
90 0. 846 1. 042 1, 291 1. 662 1. 987 2. 368 2. 632 3. 183 3. 402 
91 0. 846 1. 042 1. 291 1. 662 1. 986 2. 368 2. 631 3. 182 3. 401 
92 0. 846 1. 042 1. 291 1. 662 1. 986 2. 368 2. 630 3. 181 3.399 
93 0. 846 1. 042 1. 291 1. 661 1. 986 2. 367 2. 630 3. 180 3. 398 
94 0. 845 1. 042 1. 291 1. 661 1. 986 2. 367 2. 629 3: 179 3.397 
95 0. 845 1. 042 1. 291 1. 661 1. 985 2. 366 2. 629 3. 178 3. 396 
96 0. 845 1. 042 1. 290 1. 661 1. 985 2. 366 2. 628 3. 177 3. 395 
97 0. 845 1. 042 1. 290 1. 661 1. 985 2. 365 2. 627 3. 176 3. 394 
98 0. 845 1. 042 1. 290 1. 661 1. 984 2. 365 2. 627 3.175 3. 393 
99 0. 845 1. 042 1. 290 1. 660 1. 984 2. 365 2. 626 3.175 3. 392 
100 0. 845 1. 042 1. 290 1. 660 1. 984 2. 364 2. 626 3. 174 3. 390 
101 0. 845 1. 042 1. 290 1. 660 1. 984 2. 364 2. 625 3. 173 3. 389 
102 0. 845 1. 042 1. 290 1. 660 1. 983 2. 363 2. 625 3. 172 3. 388 
103 0. 845 1. 042 1. 290 1. 660 1. 983 2. 363 2. 624 3.171 3. 388 
104 0. 845 1. 042 1. 290 1. 660 1. 983 2. 363 2. 624 3. 170 3. 387 
105 0. 845 1. 042 1. 290 1. 659 1. 983 2. 362 2. 623 3.170 3. 386 
106 0. 845 1. 042 1. 290 1. 659 1. 983 2. 362 2. 623 3. 169 3. 385 
107 0. 845 1.041 1. 290 1. 659 1. 982 2. 362 2. 623 3. 168 3. 384 
108 0. 845 1. 041 1. 289 1. 659 1. 982 2. 361 2. 622 3. 167 3. 383 
109 0. 845 1. 041 1. 289 1. 659 1. 982 2. 361 2. 622 3. 167 3. 382 
110 0. 845 1. 041 1. 289 1. 659 1. 982 2. 361 2. 621 3. 166 3. 381 
111 0. 845 1. 041 1. 289 1. 659 1. 982 2. 360 2. 621 3. 165 3. 380 
112 0. 845 1.041 1. 289 1. 659 1. 981 2. 360 2. 620 3. 165 3. 380 
113 0. 845 1. 041 1. 289 1. 658 1. 981 2. 360 2. 620 3. 164 3. 379 
114 0. 845 1. 041 1. 289 1. 658 1. 981 2. 360 2. 620 3. 163 3. 378 
115 0. 845 1. 041 1. 289 1. 658 1. 981 2. 359 2.619 3. 163 3. 377 
116 0. 845 1.041 1. 289 1. 658 1. 981 2. 359 2.619 3. 162 3. 376 
117 0. 845 1.041 1. 289 1. 658 1. 980 2. 359 2.619 3. 161 3. 376 
118 0. 845 1.041 1. 289 1. 658 1. 980 2. 358 2.618 3. 161 3.375 
119 0. 845 1. 041 1. 289 1. 658 1. 980 2. 358 2.618 3. 160 3. 374 
120 0. 845 1.041 1. 289 1. 658 1. 980 2. 358 2.617 3. 160 3. 373 
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教学 支持 说 明 
n 课件 申请 _ 
尊敬 的 老师 : 

您 好 ! 感谢 您 选用 清华 大 学 出 版 社 的 教材 ! 为 更 好 地 服务 教学 ， 我 们 为 采用 本 书 人 
为 教材 的 老师 提供 教学 辅助 资源 。 鉴 于 部 分 资源 仅 提供 给 任课 教师 使 用 ， 请 您 直接 
机 扫描 下 方 二 维 码 实时 申请 教学 资源 。 


no m 


y 


EN 

为 方便 教师 选用 教材 ， 我 们 为 您 提供 免费 赠送 样 书 服务 。 任 课 教师 扫描 下 方 二 维 码 
即 可 获取 清华 大 学 出 版 社 教材 电子 书目 。 在 线 填写 个 人 信息 ， 经 审核 认证 后 即 可 获取 所 
选 教材 。 我 们 会 第 一 时 间 为 您 寄 送 样 书 。 


| 任课 教师 扫描 二 维 码 


和 可 获取 教材 电子 书目 六 
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(a) 
E 清华 大 学 出 版 社 
E-mail: tupfuwu@163.com 网 址 : http://www.tup.com.cn/ 
电话 : 8610-62770175-4506/4340 传真 : 8610-62775511 


地 址 : 北京 市 海淀 区 双 清 路 学 研 大 厦 B 座 509 室 邮编 : 100084 


